避免在read_csv中读取multindex

问题描述

我正在尝试读取csv,在特定行中似乎有问题。

由于出现错误,我正在尝试研究问题

Error tokenizing data. C error: Expected 23 fields in line 27,saw 37

这是我发现的:

前26行读成OK:

zero=pd.read_csv(basepath/nome,low_memory=False,dtype=str,delimiter=";",nrows=25)

但是在第26行,即使数据库没有multindex,该函数也会采用multindex数据帧。

zero=pd.read_csv(basepath/nome,skiprows=25)

即使将索引强制为None(index_col = None),结果还是一个multindex表(该表显示了索引的前9个cols)...

如何避免这种情况并正确读取csv?

解决方法

Error tokenizing data. C error: Expected 23 fields in line 27,saw 37

该行中某些字段中最有可能存在分隔符。

确保用引号引起来并用quotechar='"'


要处理包含在以下字段中的报价:

"L.E.P. DI PIROZZI CARMINE S.A.S.\"";;;;;;;; "08020650019";

escapechar='\\'可以使用。