如何正确地从其 ftp 中提取 PubMed gz 文件?

问题描述

我曾经从其 FTP 网站 (ftp.ncbi.nlm.nih.gov) 下载和更新 PubMed 文献元数据。但是最近,我无法像以前那样提取下载的压缩文件,例如“pubmed21n1249.xml.gz”等。

通过包“pubmed_pa​​rser”在 Python 中提取文件返回错误消息“错误:无法读取路径、类文件对象或字符串作为 XML”。

用WinRAR解压文件返回错误“D:\tmp_PubMed\pubmed21n1249.xml.gz:文件D:\tmp_PubMed\pubmed21n1249.xml 里出现校验和错误。该文件已损坏。”意思是“验证错误文件损坏”。

有什么建议吗?

谢谢。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)