问题描述
我是一名初级程序员,目前在 Dataiku 处理一个包含大约 27000 条记录的数据集。原始/父数据集的电话号码存储在字符串元素中,例如“0612345678”和“0229123456”。
但是,当我将此数据集加载到我的 python 脚本中时,数据类型和列内的数字发生了变化。该列现在是一个 float64 对象,示例中的电话号码如下所示:'612345678.0' 和 '229123456.0'。
我尝试使用 df['telephone_number'].astype(str)
更改列数据类型,但数据类型确实发生了变化。但是,数字仍然以错误的方式显示('612345678.0')。谁能帮我把数字改回原来的形状,以便我可以在以后的分析中使用它们?
解决方法
您可以指定要将特定列读取为哪种类型。
df = pd.read_csv("your_file.csv",dtype={'TelephoneNum': str})