问题描述
我正在尝试读取csv,在特定行中似乎有问题。
由于出现错误,我正在尝试研究问题
Error tokenizing data. C error: Expected 23 fields in line 27,saw 37
这是我发现的:
前26行读成OK:
zero=pd.read_csv(basepath/nome,low_memory=False,dtype=str,delimiter=";",nrows=25)
但是在第26行,即使数据库没有multindex,该函数也会采用multindex数据帧。
zero=pd.read_csv(basepath/nome,skiprows=25)
即使将索引强制为None(index_col = None),结果还是一个multindex表(该表显示了索引的前9个cols)...
如何避免这种情况并正确读取csv?
解决方法
Error tokenizing data. C error: Expected 23 fields in line 27,saw 37
该行中某些字段中最有可能存在分隔符。
确保用引号引起来并用quotechar='"'
。
要处理包含在以下字段中的报价:
"L.E.P. DI PIROZZI CARMINE S.A.S.\"";;;;;;;; "08020650019";
escapechar='\\'
可以使用。