Pandas 数据框中的数字已更改

问题描述

我是一名初级程序员,目前在 Dataiku 处理一个包含大约 27000 条记录的数据集。原始/父数据集的电话号码存储在字符串元素中,例如“0612345678”和“0229123456”。

但是,当我将此数据集加载到我的 python 脚本中时,数据类型和列内的数字发生了变化。该列现在是一个 float64 对象,示例中的电话号码如下所示:'612345678.0' 和 '229123456.0'。

我尝试使用 df['telephone_number'].astype(str) 更改列数据类型,但数据类型确实发生了变化。但是,数字仍然以错误的方式显示('612345678.0')。谁能帮我把数字改回原来的形状,以便我可以在以后的分析中使用它们?

解决方法

您可以指定要将特定列读取为哪种类型。

df = pd.read_csv("your_file.csv",dtype={'TelephoneNum': str})

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...