无法使用 pyspark ML 库对测试数据集进行预测

问题描述

我正在使用 pyspark ML lib 处理机票价格预测数据集,其中包含训练数据集和测试数据集。我已经在火车数据集上成功实现了我的模型并预测了价格,即标签列,但不知道如何在测试数据集上应用相同的模型来预测票价。

以下代码用于在训练数据集(包含特征和标签列)上训练模型。

from pyspark.ml.regression import GBTRegressor

gbt = GBTRegressor(featuresCol="features",labelCol = "Price",maxIter = 10)
gbtModel = gbt.fit(training_data)

predictions_gbt = gbtModel.transform(testing_data)
predictions_gbt.select("features","Price","prediction").show()

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)