aws athena 将 array<array<string>> 转换为 table

问题描述

我有一个 s3 存储桶,里面有很多包含此内容文件

{time:123456,state:{{1,2,3,4},{4,5,6,7}...}

我用Athena读取后,结果是2列的数据集:第一个是时间int,第二个是array<array<string>>,是否可以用athena sql转换这个表到:

select time,col1,col2,col3,col4
from table

当 col1...4 是数组中列的名称时?

解决方法

使用 CROSS JOIN UNNEST 取消嵌套上层数组:

select a.time,state_array[1] as col1,state_array[2] as col2,state_array[3] as col3,state_array[4] as col4
from my_table a
CROSS JOIN UNNEST(state) as t(state_array)