使用 Pandas 读取 zipfile

问题描述

我目前正在尝试读取我压缩为 zip 文件的 csv 文件(此 zip 文件仅包含我的 csv)。我试图简单地编写 pd.read_csv("trigramme_matrix.zip")(如文档中所建议的那样),但这会返回 NotImplementedError: compression type 9 (deflate64)。 然后我尝试使用带有 z = zipfile.ZipFile("trigramme_matrix.zip","r")pd.read_csv(z.read("trigramme_matrix.csv")) 的 zipfile 模块解决我的问题,但它一直抛出相同的错误

搜索了是否可以对此错误有任何见解,但我得到的信息对我没有多大帮助...

我提前感谢你。

解决方法

我假设您像我一样使用 Windows,如果情况并非如此,请告诉我。在 Windows XP 及更高版本中解压缩 9 型 Zip 文件很容易,因为它们内置了对 Zip 文件的支持。我假设您是在运行 python 代码之前这样做的。如果您想在运行时执行此操作,我们遇到的旧帖子中有使用 7Zip 软件在运行时解压缩的代码。

步骤 1:从 9 类 Zip 文件中提取 csv

enter image description here

Windows 资源管理器将像打开任何普通文件夹一样打开 Zip 文件。必须复制 zip 文件中的 csv 文件并将其粘贴到所需的文件夹中。

第 2 步:我们可以再次使用 Windows 资源管理器将 csv 压缩,这次是普通 zip(不是类型 9),这是 Windows 资源管理器使用的默认值

enter image description here

第 3 步:如果您出于某种原因想使用命令行,一种方法是获取一些与命令行配合使用的解压缩软件,例如 http://stahlworks.com/dev/unzip.exe

请确保使用防病毒软件进行扫描

enter image description here