加载管道分隔的CSV数据,其蜂巢中的一列中带有“双引号

问题描述

我的数据如下:-

Rollno|Name|height|department
101|Aman|5"2|C.S.E

将所有列作为字符串。 当我在蜂巢中加载以上数据时,我在开始和结束时都得到了额外的报价,如下所示:- 罗尔诺:-“ 101 名称:-阿曼 高度:-5“ 2 部门:-C.S.E“ 谁能帮我解决这个问题。

解决方法

指定分隔符,例如:

val df = spark.read.option("header","true").option("inferSchema","true").option("sep","|").csv("test.csv")
df.show(false)

+------+----+------+----------+
|Rollno|Name|height|department|
+------+----+------+----------+
|101   |Aman|5"2   |C.S.E     |
+------+----+------+----------+

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...