如何解释2个虚拟变量之间的相互作用项的系数

问题描述

我使用逻辑回归，试图对女性的边际效应和贫困线以下的收入（均为二元变量）进行建模，以预测发生高血压的可能性。我创建了一个交互项（poverty_FEMALE）来尝试对此建模，但是不确定我对系数的解释是否正确。

说的正确吗？

低于阈值和男性的边际效应是：.067-.055
成为女性而不是处于贫困状态的边际效应是：.041-.055
女性和贫困的边际影响是-.055？

如果是这样，当这两个变量的系数各自为正值时，为什么贫困和女性的风险较低？

pov_FEMALE=(df$BELOW_100_POVERTY*(df$FEMALE))

Marginal Effects:
                       dF/dx  Std. Err.       z     P>|z|    
BELOW_100_POVERTY  0.0670417  0.0243266  2.7559 0.0058531 **  
FEMALE             0.0410705  0.0172280  2.3839 0.0171283 *  
pov_FEMALE        -0.0553485  0.0160284 -3.4531 0.0005541 ***

解决方法

假设显示的dF / dx是您想要的边际效应类型，

低于阈值（0.067）而男性（0）的边际效应是：.067
是女性（0.041）而没有处于贫困状态（0）的边际效应是：0.041
女性（0.041）和贫困（0.067）及共同状况（-0.055）的边际影响是：0.041 + 0.067 -.055

考虑偏导数的含义。当您对变量x求估计方程的偏导数时，直接效应和相互作用效应是相加的。

假设您描述的变量是指标（值是1或0），则不会从截距中单独识别基数（值0，例如“ male”）的边际效应。人们只能将结果解释为基线概率加边际效应，在这种情况下，基线被定义为男性和非贫困人群。

analysis coefficients marginal-effects r r regression