问题描述
嗨,我有一个 Tuple3 列表,我正在尝试转换到 Java 中的 DataSet。有人可以帮助我吗。当我尝试通过调用 parallelize 方法转换到 rdd 时,它给出了编译错误:可以有人请帮助我如何将其转换为 Java 中的数据集/数据帧
SparkSession session=SparkSession.builder().config(conf).getorCreate();
List<Tuple3> lisofData=new ArrayList();
lisofData.add(new Tuple3("debo","BigData",1000000000));
lisofData.add(new Tuple3("debo1","BigData1",1077700));
lisofData.add(new Tuple3("debo222","BigDa77ta",377779999));
lisofData.add(new Tuple3("deb666o","B3333igData",78666));
lisofData.add(new Tuple3("deb333o","B222igData",177000));
lisofData.add(new Tuple3("deb3456o","BigDa4432ta",76568));
StructType structType= DataTypes.createStructType(Arrays.asList(
DataTypes.createStructField("name",DataTypes.StringType,true),DataTypes.createStructField("department",DataTypes.createStructField("salary",DataTypes.IntegerType,true)
));
//Below line is not getting complied.
JavaRDD<Tuple3<String,String,Integer>> rdd = session.sparkContext().parallelize(lisofData);
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)