ValueError:发现样本数量不一致的输入变量:[650, 1300]

问题描述

我正在尝试运行多元(多个 y)回归算法。代码如下。

data = pd.read_csv('data.csv')
X = data[['PM','Na','Cl','Al','Si','Ti']].values
y = data[['AD','SS']].values
X_train,X_test,y_train,y_test = train_test_split(X,y.flatten(),test_size = 0.3,random_state = 42)

ValueError: 发现输入变量的样本数量不一致:[650,1300] 在分割步骤。

我尝试在 google 上搜索,但找不到任何内容。有人请指导我如何选择多个 y 值。

提前致谢!

解决方法

Xy 的长度不同。

要亲眼看看,请使用 X.shapey.shape