问题描述
正如官方 site 中提到的,parquet 对嵌套结构的设计作为核心元素提供了广泛的支持:
Parquet is built from the ground up with complex nested data structures in mind,and uses the record shredding and assembly algorithm described in the Dremel paper. We believe this approach is superior to simple flattening of nested name spaces.
支持嵌套结构涉及哪些权衡?除了这种支持之外,是否有类似于 Parquet 的文件格式(即至少需要是柱状、二进制、类型/模式、高级压缩)?如果我只处理平面表格,使用其他格式是否会有所收获?
我对支持轻松更新和删除的文件格式特别感兴趣。我不确定不支持嵌套模式是否会在这个方向上有所帮助。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)