尾部定界符使大熊猫感到困惑read_csv

问题描述

我创建了一个GitHub问题来看看如何自动处理此问题:

https://github.com/pydata/pandas/issues/2442

我认为FEC文件格式略有变化,从而引起了这一烦人的问题-如果您使用http://github.com/pydata/pydata- book上发布的文件,则希望不会出现此问题。

解决方法

一个csv(以逗号分隔)文件,其中的行带有一个额外的尾随定界符,似乎令人困惑pandas.read_csv。(数据文件为[1])

它将多余的定界符视为存在额外的列。因此,除了标题所需的内容外,还有一列。然后pandas.read_csv将第一列作为行标签。总体效果是,列和标题不再对齐-
第一列成为行标签,第二列由第一个标题命名,依此类推。

这很烦人。知道如何判断正确pandas.read_csv的事情吗?我找不到一个。

很棒的书,顺便说一句。


[1]:《 Python for Data Analysis 》一书第9章中的2012 FEC选举数据库 __