Athena CSV:尾部斜杠问题

问题描述

我有一个如下的 csv 文件

a,b,c
1,2,3
1,"She said ""Hi!""",2\,"2,0\",3

以及如下创建的 Athena 表

CREATE EXTERNAL TABLE `david_korean_test`(
`a` string COMMENT 'from deserializer',`b` string COMMENT 'from deserializer',`c` string COMMENT 'from deserializer')
ROW FORMAT SERDE 
'org.apache.hadoop.hive.serde2.OpenCSVSerde' 
WITH SERDEPROPERTIES ( 
'escapeChar'='\"','quoteChar'='\"','separatorChar'=',') 
STORED AS INPUTFORMAT 
'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
'org.apache.hadoop.hive.ql.io.HiveIgnoreKeytextoutputFormat'
LOCATION
's3://...'
TBLPROPERTIES (
'skip.header.line.count'='1')

前 2 行显示正常,但斜线导致第 3 行和第 4 行出现问题

第 3 行 b 列只有 2,而第 4 行 b 和 c 列为空。

是否有可以帮助解决此问题的设置还是已知问题?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)