交互作用不显着,但有一个简单的显着影响:R

问题描述

背景:我已经在R中使用lmer()lme4包)拟合了线性混合模型,并使用两个二进制分类预测变量作为伪变量。一个( Intervention )是对象内部,而另一个( Sex )在对象之间。该模型说明了具有随机效应的两个相关级别(数据结构和下面描述的模型代码)。结果是比例,但是它们表现得很好-平均值大约为0.5,范围在0.2到0.9之间,并且它们非常呈正态分布。随后,残差表明满足假设(正态,等方差)。因此,我不认为我所观察到的是由于违反了线性(混合)模型的假设。

问题:无论我使用哪种随机效应结构(下面列出),以下内容都是正确的:在每种情况下,两个二进制类别预测变量之间的交互项的检验统计量都是数量级为1.7,而其中一个二进制预测变量的值始终约为2.8(另一个的测试统计值为〜1.3)。尽管存在关于如何为这些类型的模型准确计算 p 值的问题(以及我们是否应该-我知道这一讨论点),但是很明显无论如果使用自由度,则交互项不会被认为具有统计学意义(例如α= 0.05),而一个预测变量会具有统计学意义。请注意,这里的单个预测变量的估计是简单效果,因为它是二进制和伪编码的。我用emmeans()查看了所有四种可能的简单效果,只有一种在统计上有意义(测试统计量约为2.8)。

我无法弄清楚交互作用如何缺乏意义,但四个可能的简单影响之一是显着的。我可以看到测试统计信息/ p 值是否为“边界线”,这使其成为潜在的权力问题。但是,此处交互项的球形 p 值(测试统计〜1.7)约为0.09,而简单效果的粗糙 p 值(测试统计〜 2.8)约为0.005。对于我来说,它们之间的差异可能会很大,这让我担心,我担心我固有地对数据建模不正确,尽管如果这样,我看不到错误之处。

数据结构:每个受试者在六幅不同的图像中观察到的比例(在他们可能被随机分配的12种可能的图像中):干预前查看了三幅图像,干预后查看了三幅介入。因此,由于被摄体和图像存在潜在的相关性,因此将它们视为随机效应。最后,干预是受试者内部的,而 Sex 是介于受试者之间的。

这是一个很小的虚拟数据集(不是实际数据,唯一的主题数是59(一种性别是29,另一种性别是30)):

structure(list(Subject = c(1L,1L,2L,3L,4L,5L,6L,6L),Image = c("B","A","G","E","C","I","L","D","F","K","B","H","J","D"),Intervention = c("Pre","Pre","Post","Post"),Sex = c("Female","Female","Male","Male"),Prop = c(0.488277,0.236734,0.41036,0.745403,0.464705,0.625076,0.5602122,0.590909,0.333266,0.365954,0.374941,0.662141,0.64877,0.434947,0.721343,0.5288113,0.782714,0.603777,0.4480342,0.629813,0.347684,0.41906,0.553854,0.639324,0.389804,0.49155,0.355763,0.695487,0.537433,0.650022,0.54022,0.58907,0.666208,0.713883,0.625882,0.434924)),class = "data.frame",row.names = c(NA,-36L))

考虑的候选模型,每个模型具有不同的随机效应

模型1 (产生收敛警告):请注意输出是来自我的 actual 数据(不是上面给出的虚拟数据集):

largest_lmer <- lmer(Prop ~ factor(Sex)*factor(Intervention) +
                            (1 | Image) +
                            (1 + Intervention | Subject),data = data01)

coef(summary(largest_lmer))
#                                            Estimate Std. Error   t value
# (Intercept)                              0.51415277 0.03503742 14.674389
# factor(Sex)Male                          0.04019813 0.03006458  1.337059
# factor(Intervention)Pre                  0.05123982 0.01830275  2.799569
# factor(Sex)Male:factor(Intervention)Pre -0.04238911 0.02509809 -1.688938

install.packages("emmeans")
library(emmeans)

largest_lmer_emm_Int <- emmeans(largest_lmer,~ factor(Sex) | factor(Intervention))
pairs(largest_lmer_emm_Int)
# Intervention = Post:
#  contrast      estimate     SE   df t.ratio p.value
#  Female - Male -0.04020 0.0301 57.3 -1.336  0.1867 
# 
# Intervention = Pre:
#  contrast      estimate     SE   df t.ratio p.value
#  Female - Male  0.00219 0.0307 57.2  0.071  0.9434 
# 
# Degrees-of-freedom method: kenward-roger

largest_lmer_emm_Sex <- emmeans(largest_lmer,~ factor(Intervention) | factor(Sex))
pairs(largest_lmer_emm_Sex)
# Sex = Female:
#  contrast   estimate     SE   df t.ratio p.value
#  Post - Pre -0.05124 0.0184 56.5 -2.789  0.0072 **This is the significant simple effect**
# 
# Sex = Male:
#  contrast   estimate     SE   df t.ratio p.value
#  Post - Pre -0.00885 0.0172 55.0 -0.515  0.6084 
# 
# Degrees-of-freedom method: kenward-roger

模型2 :所有输出均与模型1相似(此处不再赘述):

medium_lmer <- lmer(Prop ~ factor(Sex)*factor(Intervention) + 
                           (1 | Image) +
                           (1 | Subject) +
                           (1 | Intervention:Subject),data = data01)

模型3 :所有输出均与模型1相似(此处不再赘述):

smallest_lmer <- lmer(Prop ~ factor(Sex)*factor(Intervention) + 
                             (1 | Image) +
                             (1 | Subject),data = data01)

正如我提到的,这些候选模型的 all 全部给出了上面提到的测试统计数据-它们没有随所包含的随机效应而变化。满足模型的假设(正态性,均方差)。还有其他我想念的东西吗?还是在数学上可能没有什么相互作用,但是在其测试统计量/ p -值方面,显着的简单效果与这两者相差很大? / p>

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...