使用并行化方法将 Tuple3 转换为 Java RDD

问题描述

嗨,我有一个 Tuple3 列表,我正在尝试转换到 Java 中的 DataSet。有人可以帮助我吗。当我尝试通过调用 parallelize 方法转换到 rdd 时,它给出了编译错误:可以有人请帮助我如何将其转换为 Java 中的数据集/数据帧

 SparkSession session=SparkSession.builder().config(conf).getorCreate();
List<Tuple3>  lisofData=new ArrayList();

lisofData.add(new Tuple3("debo","BigData",1000000000));
lisofData.add(new Tuple3("debo1","BigData1",1077700));
lisofData.add(new Tuple3("debo222","BigDa77ta",377779999));
lisofData.add(new Tuple3("deb666o","B3333igData",78666));
lisofData.add(new Tuple3("deb333o","B222igData",177000));
lisofData.add(new Tuple3("deb3456o","BigDa4432ta",76568));
StructType structType= DataTypes.createStructType(Arrays.asList(
        DataTypes.createStructField("name",DataTypes.StringType,true),DataTypes.createStructField("department",DataTypes.createStructField("salary",DataTypes.IntegerType,true)

));


//Below line is not getting complied.

    JavaRDD<Tuple3<String,String,Integer>> rdd = session.sparkContext().parallelize(lisofData);

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)