pandas read_csv 有没有办法像处理缺失数据一样处理错误数据?

问题描述

例如,当我读取转换为 CSV 的旧 DBase 文件时,我发现单元格带有 ** 而不是应该包含整数数据的列中的数字。 (我怀疑这是由于超出了该列 'SOME_COL,N,2,0' 的限制,该列的设计应具有从 0 到 99 的值,之后有 ** 为 100,依此类推)

我阅读了很多关于熊猫处理 missing data内容,但找不到关于 erroneous data 的任何信息。

那么有没有办法对这样的错误做些什么呢? ValueError: Unable to parse string "**" at position 4689

也许我应该编写一些自定义转换器(如果可能的话)或者有更好的方法吗?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)