问题描述
我使用逻辑回归,试图对女性的边际效应和贫困线以下的收入(均为二元变量)进行建模,以预测发生高血压的可能性。我创建了一个交互项(poverty_FEMALE)来尝试对此建模,但是不确定我对系数的解释是否正确。
说的正确吗?
- 低于阈值和男性的边际效应是:.067-.055
- 成为女性而不是处于贫困状态的边际效应是:.041-.055
- 女性和贫困的边际影响是-.055?
如果是这样,当这两个变量的系数各自为正值时,为什么贫困和女性的风险较低?
pov_FEMALE=(df$BELOW_100_POVERTY*(df$FEMALE))
Marginal Effects:
dF/dx Std. Err. z P>|z|
BELOW_100_POVERTY 0.0670417 0.0243266 2.7559 0.0058531 **
FEMALE 0.0410705 0.0172280 2.3839 0.0171283 *
pov_FEMALE -0.0553485 0.0160284 -3.4531 0.0005541 ***
解决方法
假设显示的dF / dx是您想要的边际效应类型,
-
低于阈值(0.067)而男性(0)的边际效应是:.067
-
是女性(0.041)而没有处于贫困状态(0)的边际效应是:0.041
-
女性(0.041)和贫困(0.067)及共同状况(-0.055)的边际影响是:0.041 + 0.067 -.055
考虑偏导数的含义。当您对变量x求估计方程的偏导数时,直接效应和相互作用效应是相加的。
假设您描述的变量是指标(值是1或0),则不会从截距中单独识别基数(值0,例如“ male”)的边际效应。人们只能将结果解释为基线概率加边际效应,在这种情况下,基线被定义为男性和非贫困人群。