问题描述
有什么办法可以在 numpy.polyfit() 中拟合两个自变量和一个因变量?
我有一个从 csv 文件加载的熊猫数据框。 我希望包含两列作为自变量以使用 NumPy 运行多元线性回归。
目前我的简单线性回归如下所示:
sed -i.bak -E 's/(",)[[:blank:]]*/\1\
/g' file.txt
我也希望在 x 中包含 model_combined = np.polyfit(data.Exercise,y,1)
。
解决方法
假设您的方程为 a * exercise + b * age + intercept = y
,您可以使用 numpy 或 scikit-learn 拟合多元线性回归,如下所示:
from sklearn import linear_model
import numpy as np
np.random.seed(42)
X = np.random.randint(low=1,high=10,size=20).reshape(10,2)
X = np.c_[X,np.ones(X.shape[0])] # add intercept
y = np.random.randint(low=1,size=10)
# Option 1
a,b,intercept = np.linalg.pinv((X.T).dot(X)).dot(X.T.dot(y))
print(a,intercept)
# Option 2
a,intercept = np.linalg.lstsq(X,y,rcond=None)[0]
print(a,intercept)
# Option 3
clf = linear_model.LinearRegression(fit_intercept=False)
clf.fit(X,y)
print(clf.coef_)