从银行读取html导出时出错 R $ 0,64被读取为64类型numpy.float64

问题描述

我正在开发一个程序,用于从银行读取HTML导出内容,以创建带有Python费用的数据框。 当使用df = pd.read_html(io='jan-2020.html')读取HTML文件时,积分列会将信息读取为NumPy.float64并误解了语言环境,因此,将读取0,64(以逗号为分隔符的64美分)数据帧中的值为64(64巴西雷亚尔),而不是0.64(64美分)。另一个示例是,将2.650,73的信用记为2.65073(将百分号的逗号忽略不计)。 我认为这与我使用的系统的不同语言环境(macOS Catalina 10.15.7)和导出文件的银行系统(巴西银行)有关。 如果我在计算机上运行locale.getlocale(),则会从系统得到以下答复:('en_US','UTF-8') 如何纠正?我的意思是,我该如何读取HTML导出文件并正确获取正确读取的值(将0,64读取为0.64)等等? 有趣的是,HTML导出中下一列中的值被读取为“ str ”,但我已经弄清楚了。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)