在Python中使用xmltodict的MemoryError

问题描述

我正在尝试将Saliva Metabolites数据集的XML文件HMDB解析为字典列表。为此,请使用xmldict软件包。我尝试创建的数据格式和输出结构是第一个previews question posted中编写段落的代码

这是代码

# Import packages
import xml.etree.ElementTree as et
import xmltodict

# load data
data1 = et.parse('D:/path/To/Projects/HMDB/DataSets/saliva_Metabolites/saliva_Metabolites.xml')
root = data1.getroot()

xmlstr = et.tostring(root,encoding='utf-8',method='xml')
data_dict = dict(xmltodict.parse(xmlstr))

现在,当尝试访问特定键时:

>> data_dict['ns0:hmdb']
Traceback (most recent call last):
  File "<input>",line 1,in <module>
MemoryError

我正在使用Pycharm,并在对象data_dict旁边注意到写成:Unable to get repr for <class 'dict'>

不知道我的系统还需要什么其他信息:

>> print(sys.version)
3.8.5 (tags/v3.8.5:580fbb0,Jul 20 2020,15:43:08) [MSC v.1926 32 bit (Intel)]

任何想法,提示或线索将不胜感激

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)