如何预测测试集?

问题描述

我正在逐步跟踪kaggle的课程部分。有些事情我无法弄清楚。.我试图预测我的模型,但是它不起作用,我搜索了一些主题,但是找不到有用的东西..这是代码的最后一部分;

> df
   ID val1 sig1 val2 sig2  val3 sig3 first_val first_val_value
1 ID1    0 0.76 0.25 0.65  0.26 0.64         -               -
2 ID2    1 0.15 0.81 0.09  0.24 0.62      val1               1
3 ID3    0 0.35 0.21 0.55  0.16 0.65      val1               0
4 ID4    0 0.66 0.06 0.88 -0.10 0.80         -               -
5 ID5    0 0.70 0.18 0.09  0.22 0.04      val2            0.18
6 ID6    0 0.72   NA   NA    NA   NA         -               -

一键编码删除索引;放回去

final_encoder =OneHotEncoder(handle_unkNown='ignore',sparse=False)
final_X_train = pd.DataFrame(final_encoder.fit_transform(X_train[low_cardinality_cols]))
final_X_valid = pd.DataFrame(final_encoder.transform(X_valid[low_cardinality_cols])) 

删除分类列(将替换为一键编码)

final_X_train.index =X_train.index
final_X_valid.index =X_valid.index

将一键编码列添加到数字特征

num_X_train = X_train.drop(object_cols,axis=1)
num_X_valid = X_valid.drop(object_cols,axis=1)

直到这里没有问题..但是当我运行这部分时;

final_2_X_train =pd.concat([num_X_train,final_X_train],axis=1)
final_2_X_valid =pd.concat([num_X_valid,final_X_valid],axis=1)`

我遇到了错误:: final_X_test =pd.DataFrame(final_encoder.transform(X_test)) preds_test = final_X_test`

我在github和stackoverflow上搜索的东西也没有用..知道吗? 顺便说一句,如果您想查看完整的代码https://www.kaggle.com/ugurlumucahit/exercise-categorical-variables

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)