如何在Python中读取嵌套的struct Parquet文件?

问题描述

我有一个包含结构列表的镶木地板文件,我似乎无法使用任何可用的python镶木地板库读取该文件。其中一些返回错误,指出尚不支持“结构列表”,而其他一些则仅使用“无”对象制作一个熊猫数据框。如果有人对此有任何经验,将会有很大帮助。在过去的几天里,我一直在为此而努力。还有其他方法可以通过编程方式以某种方式读取文件或将该文件转换为其他格式然后读取吗?

我希望可以使用不涉及调用或启动其他服务(例如Spark)的Python来调用python本机支持或c库。

解决方法

尝试卸载pyarrow并安装fastparquet。这对我有用。我试图使用熊猫将其转换为CSV。

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...