问题描述
df
是一个数据框,使用 Faker
库(用于生成数据集)创建。
我想评估df
,将列名作为字符串存储在一个列表中;以及它们在第二个列表中的适当数据类型。
到目前为止,我已经:
columns = []
dtypes = []
for col_name,values in df.iteritems():
columns.append(col_name)
print(col_name)
我坚持使用检测给定列的数据类型的解决方案。可以存储为数据类型类本身或字符串文字。
注意:不需要评估整个列表 df.column.values()
,因为每个实例/记录都必须遵循 Faker 提供的相同格式。因此,评估第一列的值就足够了。
解决方法
我自己提出的解决方案,建议使用 df.types
。
关键是 str(type(values[0]))[7:-1]
,我将类输出转换为 string
并在我想要的 dtype 之前和之后执行 slicing
个字符(保留单引号)。>
columns = []
dtypes = []
for col_name,values in df.iteritems():
columns.append(col_name)
print(col_name)
dtypes.append(type(values[0]))
print(str(type(values[0]))[7:-1])