使用二项式数据时,如何将女性和男性视为二进制变量?

问题描述

我是R / R Studio的入门者,通常是编码和统计信息。

在R中,我运行的是GLM,其中我的Y变量为否/是(0/1)类别,而我的X变量为性别类别(男女)。

所以我运行了以下脚本:

hello <- read.csv(file.choose())
hello$sexbin <- ifelse(hello$Sex == 'm',ifelse(hello$Sex == 'f',1,NA))
modifhello <- subset(hello,hello$Combi_cag_long>=36)
model1 <- glm(modifhello$VAB~modifhello$Sex,family=binomial(link=logit),na.action=na.exclude,data=modifhello)
summary.lm(model1)

但是,在我的输出中,R似乎将男性/女性分开为两个单独的变量,这表明它没有将它们视为适当的二进制变量:

    Coefficients

                         Estimate      Std. Error      t value    Pr(>|t|)

          (Intercept)    -3.689         1.009          -3.656     0.000258 ***
          modifhello$Sexf 2.506         1.010          2.482       0.013084 *  
          modifhello$Sexm 2.922         1.010          2.894     0.003820 ** 
          ---
          Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

我需要在脚本中添加些什么来纠正此问题?

找到解决方

需要简单地将modifhello $ VAB〜modifhello $ sexbin而不是modifhello $ VAB〜modifhello $ sex(因为这是旧列)。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)