SAS HPGENSELECT中的型号选择详细信息

问题描述

我使用SAS HPGENSELECT对二进制目标进行变量选择:proc hpgenselect data = build lassosteps = 100;类var2;模型目标(降序)=&vars。 / distribution = binary; 选择方法= LASSO(选择= AIC停止=无)details = all;

输出看起来像这样:

enter image description here

在这里有几个问题:

  1. 基于文档,我对一般过程的理解是: a)在步骤1中,&vars中的每个候选自变量(x)。使用GLM函数拟合逻辑回归模型y〜x。然后选择其中的重要效应子作为固定变量。 b)在第2步中,&vars中的每个剩余候选变量(x)。使用拟合逻辑回归模型y〜x + var1 + var2,并选择最重要的效应子作为固定变量,依此类推。 c)当&vars中的每个变量时,该过程停止。已输入模型。那么,具有最小AIC值的步骤就是最终选择的模型。 这种理解正确吗?如果是的话,我想知道LASSO在这里何时起作用。

  2. 根据文档,在每个步骤中输入最重要的效应子。但是,我注意到输入顺序不是基于每个变量的P值(y〜x)。我想知道这里使用哪个标准来确定每个步骤的最重要效应子。

  3. 在步骤2中显示了2个lambda数字,我想知道对lambda = 0.5流程做了什么?

  4. 在步骤3中,删除了var3。我想知道使用哪个标准来确定var3的删除

如果您有上述任何问题,请分享。非常感谢!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)