从银行读取html导出时出错 R $ 0,64被读取为64类型numpy.float64

问题描述

我正在开发一个程序，用于从银行读取HTML导出内容，以创建带有Python费用的数据框。当使用df = pd.read_html(io='jan-2020.html')读取HTML文件时，积分列会将信息读取为NumPy.float64并误解了语言环境，因此，将读取0,64（以逗号为分隔符的64美分）数据帧中的值为64（64巴西雷亚尔），而不是0.64（64美分）。另一个示例是，将2.650,73的信用记为2.65073（将百分号的逗号忽略不计）。我认为这与我使用的系统的不同语言环境（macOS Catalina 10.15.7）和导出文件的银行系统（巴西银行）有关。如果我在计算机上运行locale.getlocale()，则会从系统得到以下答复：（'en_US'，'UTF-8'）如何纠正？我的意思是，我该如何读取HTML导出文件并正确获取正确读取的值（将0,64读取为0.64）等等？有趣的是，HTML导出中下一列中的值被读取为“ str ”，但我已经弄清楚了。

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）