Y 的 Kfold 交叉验证不均匀拆分

问题描述

我想用 sklearn.kfold 拆分我的数据。这是我的代码

kf = KFold(n_splits = 10)

print(np.shape(X_1))
print(np.shape(y))


for train_index,test_index in kf.split(y):
        
    X_train,X_test = X_1.values[train_index],X_1.values[test_index]
    y_train,y_test = y[train_index],y[test_index]
    

print(np.shape(X_train))
print(np.shape(X_test))

print(np.shape(y_train))
print(np.shape(y_test))

分割前X和Y的形状分别是(41437,8)和(41437,)

分割X_train后,X_test有(37294,8),(4143,8) 但是 Y 有 (29005,),)

很多 Y 数据从 Y_train 中消失了。

它去哪儿了?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)