我正在使用Apache Spark和
Scala.
28,Martok,49,476 29,Nog,48,364 30,Keiko,50,175 31,Miles,39,161
列表示ID,名称,年龄,numOfFriends.
在我的Scala对象中,我使用来自csv文件的SparkSession创建数据集,如下所示:
val spark = SparkSession.builder.master("local[*]").getorCreate() val df = spark.read.option("inferSchema","true").csv("../myfile.csv") df.printSchema()
当我运行程序时,结果是:
|-- _c0: integer (nullable = true) |-- _c1: string (nullable = true) |-- _c2: integer (nullable = true) |-- _c3: integer (nullable = true)