将txt文件读取到熊猫时,截断的开头字符串字符

问题描述

我正在尝试使用pandas.read_fwf将txt文件读取到熊猫数据。这是我的代码行:

klia_sepang = pd.read_fwf('KLIA_SEPANG.txt',sep ='[] {1,}')

但是,我发现所有第100个小数位的字符串都将在开头被截断。因此791.0变为91.0,309.0变为09.0,依此类推。我不确定为什么会这样。我尝试添加colspecs和widths之类的参数无济于事。

txt file

pandas data

解决方法

查看您的文本文件,您可能想使用widths或colspec参数来定义如何将文件分成几列。否则,仅让read_fwf推断如何组织数据列就可以成功。

我认为在这些字符中传递“ sep”不会有帮助,这可能会使解析器感到困惑。