为什么 numpy 在尝试预测回归时会引发异常错误:“ufunc 'add' 不包含具有签名匹配类型的循环”?

问题描述

我目前正在尝试使用测试和训练数据创建多元线性回归以估算房价(通过使用两个名为“Quadratmeter”和“Gewinn”的回归量)。

我想在模型中插入一些测试数据,并将预测的 y 值与实际值进行比较。因此,我使用了一个 for 循环来并排显示它们。

这是使用的全部代码

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression

df = pd.read_csv("...")

head = df.head()
pd.set_option('display.expand_frame_repr',False)
print(head)

X = df[["Gewinn","Quadratmeter"]]
y = df[["Preis in Mio"]]


X_train,X_test,y_train,y_test = train_test_split(X,y,random_state=0,test_size=0.25)

model = LinearRegression()
model.fit(X_train,y_train)

print(model.intercept_)
print(model.coef_)

# complete model: Preis = 6.48370247 + Gewinn * 6.39855984e-06 + Quadratmeter * 3.89642288e-03 + e

y_test_pred = model.predict(X_test)

for i in range(0,len(y_test_pred)):
    print(y_test_pred[i][0] + "-" + y_test[i][0])

不幸的是,在尝试运行程序时出现以下错误代码(这是由于 for 循环):

numpy.core._exceptions.UFuncTypeError: ufunc 'add' did not contain a loop with signature `enter code here`matching types (dtype('<U32'),dtype('<U32')) -> dtype('<U32')

不幸的是,我不知道如何解决这个问题。 谁能给个提示

感谢任何帮助。

解决方法

如果您想比较 y_test_pred y_test,我建议创建一个包含这两个值的数据框。这使比较更容易,而且您可以保存值并进行计算。

results_df = pd.DataFrame({'predictions': y_test_pred,'actual_values':y_test})