从 csv (pandas) 读取数据

问题描述

我有两张桌子:

reference_id 排他性
0047465 奢华
0165797 奢华
0013286 选择性
BB010 选择性
ticket-reference_id product-reference_id
2017010105521000016V 47465
2017010105521000090V 165797
2017010105521000111V 13286
2017010105521000111V BB010

对于这两个表,我都使用了代码

    pd.read_csv('df1.csv',sep = ';')
    pd.read_csv('df2.csv',sep = ';')

但是在第二个表中的 product_reference_id 列中缺少零。 product_reference_id 和 reference_id 列中的值必须相同。这样我就可以加入两个表。

解决方法

您确定 CSV 本身具有前导 0 吗?您能否粘贴与数据框表中的行相对应的每行的第一行?

假设 CSV 本身都有 0,那么您只需要将这些列作为字符串读取。由于看起来两个 CSV 中的两个列都是字符串 y,因此您可以像这样读取它们:

pd.read_csv('df1.csv',dtype=str,sep=';')

pd.read_csv('df2.csv',sep=';')

如果您想将某些列作为其他数据类型读入,您可以使用 dict for dtype 与各个列和类型。有关信息,请参阅 the pandas docs for read_csv