PipelinedRDD' 对象没有属性 '

问题描述

我正在尝试在 pyspark 中构建电影推荐模型，但在我尝试训练模型时，我不断收到“PipelinedRDD”对象没有属性“_jdf”。

导入库：

from pyspark.ml.recommendation import ALS

加载数据：

df = sc.textFile('ml-latest-small/ratings.txt').map(lambda x: x.split("::").toDF(["user","item","rating","timestamp"]))

X_train,X_test = df.randomSplit([0.8,0.2])

als = ALS(rank=5,maxIter=10,seed=0)
model = als.fit(X_train)

错误：

AttributeError: 'PipelinedRDD' object has no attribute '_jdf'

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

apache-spark-mllib pyspark pyspark python

PipelinedRDD' 对象没有属性 '_jdf pyspark 数据框

问题描述

解决方法