我是否在正确考虑线性回归模型? 均方根误差

问题描述

我有以下模型:

<bound method Model.summary of Class                          : LinearRegression

Schema
------
Number of coefficients         : 18
Number of examples             : 21613
Number of feature columns      : 17
Number of unpacked features    : 17

Hyperparameters
---------------
L1 penalty                     : 10000000000.0
L2 penalty                     : 0.0

Training Summary
----------------
Solver                         : fista
Solver iterations              : 10
Solver status                  : Completed (Iteration limit reached).
Training time (sec)            : 1.2776

Settings
--------
Residual sum of squares        : 2842629034369063.5
Training RMSE                  : 364204.5762

Highest Positive Coefficients
-----------------------------
(intercept)                    : 274873.056
bathrooms                      : 8468.5311
grade                          : 842.068
sqft_living_sqrt               : 350.0606
sqft_living                    : 24.4207

Lowest Negative Coefficients
----------------------------
No Negative Coefficients       : 

这是否意味着我的方程式将是:

预测= 274873.056 + 8468.5311 [浴室] + 842.068 [成绩] ^ 2 + 350.0606 [sqft_living_sqrt] ^ 3 + 24.4207 [sqft_living] ^ 4

如果这是正确的,那么模型如何知道哪些特征属于幂2,幂3等?如果更改特征的顺序,系数会改变吗?

解决方法

我不确定我是否会跟着您介绍^ 2 ... ^ 3 ... ^ 4 .. RMSE会执行^ 2 ... ^ 2 ...(等)

这是RMSE做的事:

均方根误差

  1. 找出原始值和预测值之间的差异。
  2. 平方差异
  3. 总和所有平方差
  4. 总和平均值
  5. 平均值
  6. 的平方根

您可以在此处看到我的示例为Math SE https://math.stackexchange.com/questions/3650442/simple-calculation-from-formula-rmse/3843518#3843518

只需将您的值替换为RMSE公式。然后计算RMSE。

此致

//将