问题描述
我正在尝试运行我自己的岭回归/套索,并且我正在根据“统计学习简介”的第 251 页上的示例对我的方法进行建模。我们被告知按如下方式设置模型矩阵:
library(ISLR)
x=model.matrix(Salary∼.,Hitters)[,-1]
y=Hitters$Salary
我的问题是:为什么需要按照“[,-1]”删除一列
解决方法
我不能确定,因为我看不到其余代码,但 model.matrix()
的目的是重新设计您的输入数据,以便它准备好由回归模型进行处理。它可以将任何因素转换为一组虚拟变量。
当这个函数运行时,它会在 (Intercept)
列中创建一个额外的 1
列,所以我猜他们正在删除这个列,因为后续模型(比如 glm()
)不需要这个额外的列。