ValueError: 错误的输入形状 (560, 5) sklearn

问题描述

我开始编写学习机器模型。我有一个包含标签的 Y_train 数据集,有 5 个类。 X_train 数据集包含样本。 我尝试在逻辑回归的帮助下制作我的模型。 形状:X_train ((560,20531)) 和 Y_train ((560,5)) 具有相同的尺寸。 我看过一些与同一问题相关的出版物,但我无法解决问题。 我不知道如何纠正这个错误,你能帮我吗?

X = pd.read_csv('/Users/lottie/desktop/data.csv',header=None,skiprows=[0])
Y = pd.read_csv('/Users/lottie/desktop/labels.csv',header=None)

Y_encoded = list()
for i in Y.loc[0:,1] :
    if i == 'BRCA' : Y_encoded.append(0)
    if i == 'KIRC' : Y_encoded.append(1)
    if i == 'COAD' : Y_encoded.append(2)
    if i == 'LUAD' : Y_encoded.append(3)
    if i == 'PRAD' : Y_encoded.append(4)
Y_bis = to_categorical(Y_encoded)


#separation of the data
X_train,X_test,Y_train,Y_test = train_test_split(X,Y_bis,test_size=0.30,random_state=42)

regression_log = linear_model.LogisticRegression(multi_class='multinomial',solver='newton-cg')

X_train=X_train.iloc[:,1:]

#train model
train_train = regression_log.fit(X_train,Y_train)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)