问题描述
经历过中风的患者完成了一份关于他们语言史的问卷调查,即当他们获得第二语言 (L2) 时,他们在一天中使用第一语言 (L1) 与第二语言 (L2) 的百分比是多少。
参与者在感兴趣的变量中缺少各种值,因此我使用 R 中的 MICE 估算了缺失值。
问题是 MICE 警告不要输入存在可疑多重共线性的列。这在本问卷中很常见,因为转换为百分比时某些回答对的总和必须为 1.00。例如,当加在一起时,L1 中的 Daily Use 和 L2 中的 Daily Use 必须加起来为 100%,因为任何更大或更小都没有意义,因此这些变量之间存在依赖关系。
在这种情况下,MICE 检测到 L1 和 L2 中风后每日使用量(L1PostUse 和 L2PostUse),合计起来为 1.00,因此它没有估算 L2PostUse。
对于第一次插补:尽管存在多重共线性,我还是强迫 MICE 插补 L2PostUse 列。
强制插补:
iLUQ <- mice(MICELUQ,m=5,maxit=50,meth='pmm',seed=500,remove.collinear=FALSE)
对于第二个 PCA:我允许 MICE 不估算 L2PostUse,然后我简单地从 1.00 中减去 L1PostUse,即 1-L1PostUse,因为 L1 和 L2 的日常使用合并时必须等于 1。
所有插补的结果都相同,甚至包括 L1/L2PostUse 列的手动减法,除了一名参与者。手动减法的结果更有意义/更符合数据的趋势——但我们只是想知道这在逻辑/统计上是否合理?
已经尝试过弄乱山脊!
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)