如何从pyarrow的时间戳中获取“年”“月”“日期”?

问题描述

我试图从箭头时间戳 [s] 类型中提取“年”“月”“日期”。我知道在pandas中怎么做,如下

import pyarrow.dataset as ds
dataset = ds.dataset(path,format="csv")
table = dataset.to_table()
## following codes wont work as table is arrow type and it doesn't have the map function.
table['date'] = table['time'].map(lambda t: pd.to_datetime(t,format="%Y-%m-%d %H:%M:%s"))
table['year'],table['month'],table['day'] = table['time'].apply(lambda x: x.year),table['date'].apply(lambda x: x.month),table['date'].apply(lambda x: x.day)

最简单的选择是将此箭头 DataFrame 转换为 Pandas 并执行此操作。但是我处理的文件大小很大,不想承担将其转换为熊猫的额外成本。由于最终目标是在获得年月日之后,我想将它们用作拼花地板的分区。

尽量避免中间转换,以提高将 csv 文件转换为 parquet 的效率。这是否可以通过箭头中的当前功能实现?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...