在spark中的expr中添加列

问题描述

用列值减去时间戳时,在expr中添加列。

df.withColumn(“ out”,expr(“ timestamp-interval hour_part hours”))

输入:

id,hour_part,timestamp
1,1,2019-01-01 13:00:00
1,2,2019-01-01 14:00:00
1,2019-01-01 15:00:00
2,3,2019-01-01 17:00:00
2,4,2019-01-01 18:00:00

输出:

id,timestamp,out
1,2019-01-01 13:00:00,2019-01-01 12:00:00
1,2019-01-01 14:00:00,2019-01-01 15:00:00,2019-01-01 13:00:00
2,2019-01-01 17:00:00,2019-01-01 14:00:00
2,2019-01-01 18:00:00,2019-01-01 14:00:00

错误:org.apache.spark.sql.catalyst.parser.ParseException: 预期的多余输入“小时”(第1行,pos 28)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)