问题描述
我有一个关于在 Weka 中完成的机器学习的问题。就我而言,我想预测扇区时间,我在应用程序的 CSV 文件中记录了该时间段。我已经研究过,预测结果的最佳方法似乎是线性回归,但我一直被困在有关正确模型训练的问题上。我的数据如下:
LAP_TIME,SECTOR,TIME,THRottLE_POS_ENTER,THRottLE_POS_EXIT,GPS_LAT_ENTER,GPS_LONG_ENTER,GPS_LAT_EXIT,GPS_LONG_EXIT,SPEED_ENTER,SPEED_EXIT 1,1,5,60.1,97.7,46.371044584160394,15.09848579764366,90,105 1,2,12,33.7,99.1,46.37047850291076,15.101122073829174,55,82 1,3,20.4,57.1,46.368578953235925,15.10340765118599,41,73 1,4,46,95.3,88.6,46.36551491974933,15.101220309734343,67,94 1,33,44.4,22.8,46.366923184209014,15.097428001463413,44,87 1,6,36,13.3,46.3678583054267,15.09299732744694,110,62 1,7,23,31.2,12.3,46.36953093408058,15.094324350357057,98,79 2,35,41.7,66,102 2,17,88,59 2,28,71.2,72,100 2,48,27.9,64,84 2,32,26.3,97,92 2,34,62.9,39,71 2,74,96
关于收集到的这些数据,我想预测以秒为单位的 TIME 属性。在使用 WEKA 时,我尝试使用线性回归过滤器,并将 TIME 设置为类属性,但模型预测(使用交叉验证拆分 10 倍时)显示太多错误并且预测很糟糕。我做错了什么?
=== Predictions on test data ===
inst# actual predicted error
1 36 26.083 −9.917
2 23 26.083 3.083
1 23 26.25 3.25
2 34 26.25 −7.75
1 46 23.167 −22.833
2 48 23.167 −24.833
1 12 30 18
2 0 30 30
1 28 26.462 −1.538
1 33 26.077 −6.923
1 17 27.308 10.308
1 35 25.923 −9.077
1 5 28.231 23.231
1 32 26.154 −5.846
=== cross-validation ===
=== Summary ===
Correlation coefficient −0.9199
Mean absolute error 12.6136
Root mean squared error 15.4765
Relative absolute error 100 %
Root relative squared error 100 %
Total Number of Instances 14
编辑:如果代码格式不正确,我很抱歉,我不知道如何将 CSV 文件完全粘贴到代码块中。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)