问题描述
我有两张桌子:
reference_id | 排他性 |
---|---|
0047465 | 奢华 |
0165797 | 奢华 |
0013286 | 选择性 |
BB010 | 选择性 |
ticket-reference_id | product-reference_id |
---|---|
2017010105521000016V | 47465 |
2017010105521000090V | 165797 |
2017010105521000111V | 13286 |
2017010105521000111V | BB010 |
对于这两个表,我都使用了代码:
pd.read_csv('df1.csv',sep = ';')
pd.read_csv('df2.csv',sep = ';')
但是在第二个表中的 product_reference_id 列中缺少零。 product_reference_id 和 reference_id 列中的值必须相同。这样我就可以加入两个表。
解决方法
您确定 CSV 本身具有前导 0 吗?您能否粘贴与数据框表中的行相对应的每行的第一行?
假设 CSV 本身都有 0,那么您只需要将这些列作为字符串读取。由于看起来两个 CSV 中的两个列都是字符串 y,因此您可以像这样读取它们:
pd.read_csv('df1.csv',dtype=str,sep=';')
pd.read_csv('df2.csv',sep=';')
如果您想将某些列作为其他数据类型读入,您可以使用 dict for dtype 与各个列和类型。有关信息,请参阅 the pandas docs for read_csv。