这是处理 MICE 中多重共线性警告的合乎逻辑/安全的方法吗?

问题描述

经历过中风的患者完成了一份关于他们语言史的问卷调查,即当他们获得第二语言 (L2) 时,他们在一天中使用第一语言 (L1) 与第二语言 (L2) 的百分比是多少。

参与者在感兴趣的变量中缺少各种值,因此我使用 R 中的 MICE 估算了缺失值。

问题是 MICE 警告不要输入存在可疑多重共线性的列。这在本问卷中很常见,因为转换为百分比时某些回答对的总和必须为 1.00。例如,当加在一起时,L1 中的 Daily Use 和 L2 中的 Daily Use 必须加起来为 100%,因为任何更大或更小都没有意义,因此这些变量之间存在依赖关系。

在这种情况下,MICE 检测到 L1 和 L2 中风后每日使用量(L1PostUse 和 L2PostUse),合计起来为 1.00,因此它没有估算 L2PostUse。

对于第一次插补:尽管存在多重共线性,我还是强迫 MICE 插补 L2PostUse 列。

强制插补:

iLUQ <- mice(MICELUQ,m=5,maxit=50,meth='pmm',seed=500,remove.collinear=FALSE)

对于第二个 PCA:我允许 MICE 不估算 L2PostUse,然后我简单地从 1.00 中减去 L1PostUse,即 1-L1PostUse,因为 L1 和 L2 的日常使用合并时必须等于 1。

所有插补的结果都相同,甚至包括 L1/L2PostUse 列的手动减法,除了一名参与者。手动减法的结果更有意义/更符合数据的趋势——但我们只是想知道这在逻辑/统计上是否合理?

已经尝试过弄乱山脊!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)