Dataframe 列的数据类型 |骗子

问题描述

df 是一个数据框，使用 Faker 库（用于生成数据集）创建。

我想评估df，将列名作为字符串存储在一个列表中；以及它们在第二个列表中的适当数据类型。

到目前为止，我已经：

columns = []
dtypes = []
for col_name,values in df.iteritems():
    columns.append(col_name)
    print(col_name)

我坚持使用检测给定列的数据类型的解决方案。可以存储为数据类型类本身或字符串文字。

注意：不需要评估整个列表 df.column.values()，因为每个实例/记录都必须遵循 Faker 提供的相同格式。因此，评估第一列的值就足够了。

解决方法

我自己提出的解决方案，建议使用 df.types。

关键是 str(type(values[0]))[7:-1]，我将类输出转换为 string 并在我想要的 dtype 之前和之后执行 slicing 个字符（保留单引号）。>

columns = []
dtypes = []
for col_name,values in df.iteritems():
    columns.append(col_name)
    print(col_name)
    dtypes.append(type(values[0]))
    print(str(type(values[0]))[7:-1])

dataframe faker faker for-loop python types types types

Dataframe 列的数据类型 |骗子

问题描述

解决方法

相关问答