问题描述
用列值减去时间戳时,在expr中添加列。
df.withColumn(“ out”,expr(“ timestamp-interval hour_part hours”))
输入:
id,hour_part,timestamp
1,1,2019-01-01 13:00:00
1,2,2019-01-01 14:00:00
1,2019-01-01 15:00:00
2,3,2019-01-01 17:00:00
2,4,2019-01-01 18:00:00
输出:
id,timestamp,out
1,2019-01-01 13:00:00,2019-01-01 12:00:00
1,2019-01-01 14:00:00,2019-01-01 15:00:00,2019-01-01 13:00:00
2,2019-01-01 17:00:00,2019-01-01 14:00:00
2,2019-01-01 18:00:00,2019-01-01 14:00:00
错误:org.apache.spark.sql.catalyst.parser.ParseException: 预期的多余输入“小时”(第1行,pos 28)
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)