交互作用不显着，但有一个简单的显着影响：R

问题描述

背景：我已经在R中使用lmer()（lme4包）拟合了线性混合模型，并使用两个二进制分类预测变量作为伪变量。一个（ Intervention ）是对象内部，而另一个（ Sex ）在对象之间。该模型说明了具有随机效应的两个相关级别（数据结构和下面描述的模型代码）。结果是比例，但是它们表现得很好-平均值大约为0.5，范围在0.2到0.9之间，并且它们非常呈正态分布。随后，残差表明满足假设（正态，等方差）。因此，我不认为我所观察到的是由于违反了线性（混合）模型的假设。

问题：无论我使用哪种随机效应结构（下面列出），以下内容都是正确的：在每种情况下，两个二进制类别预测变量之间的交互项的检验统计量都是数量级为1.7，而其中一个二进制预测变量的值始终约为2.8（另一个的测试统计值为〜1.3）。尽管存在关于如何为这些类型的模型准确计算 p 值的问题（以及我们是否应该-我知道这一讨论点），但是很明显无论如果使用自由度，则交互项不会被认为具有统计学意义（例如α= 0.05），而一个预测变量会具有统计学意义。请注意，这里的单个预测变量的估计是简单效果，因为它是二进制和伪编码的。我用emmeans()查看了所有四种可能的简单效果，只有一种在统计上有意义（测试统计量约为2.8）。

我无法弄清楚交互作用如何缺乏意义，但四个可能的简单影响之一是显着的。我可以看到测试统计信息/ p 值是否为“边界线”，这使其成为潜在的权力问题。但是，此处交互项的球形 p 值（测试统计〜1.7）约为0.09，而简单效果的粗糙 p 值（测试统计〜 2.8）约为0.005。对于我来说，它们之间的差异可能会很大，这让我担心，我担心我固有地对数据建模不正确，尽管如果这样，我看不到错误之处。

数据结构：每个受试者在六幅不同的图像中观察到的比例（在他们可能被随机分配的12种可能的图像中）：干预前查看了三幅图像，干预后查看了三幅介入。因此，由于被摄体和图像存在潜在的相关性，因此将它们视为随机效应。最后，干预是受试者内部的，而 Sex 是介于受试者之间的。

这是一个很小的虚拟数据集（不是实际数据，唯一的主题数是59（一种性别是29，另一种性别是30））：

structure(list(Subject = c(1L,1L,2L,3L,4L,5L,6L,6L),Image = c("B","A","G","E","C","I","L","D","F","K","B","H","J","D"),Intervention = c("Pre","Pre","Post","Post"),Sex = c("Female","Female","Male","Male"),Prop = c(0.488277,0.236734,0.41036,0.745403,0.464705,0.625076,0.5602122,0.590909,0.333266,0.365954,0.374941,0.662141,0.64877,0.434947,0.721343,0.5288113,0.782714,0.603777,0.4480342,0.629813,0.347684,0.41906,0.553854,0.639324,0.389804,0.49155,0.355763,0.695487,0.537433,0.650022,0.54022,0.58907,0.666208,0.713883,0.625882,0.434924)),class = "data.frame",row.names = c(NA,-36L))

考虑的候选模型，每个模型具有不同的随机效应：

模型1 （产生收敛警告）：请注意输出是来自我的 actual 数据（不是上面给出的虚拟数据集）：

largest_lmer <- lmer(Prop ~ factor(Sex)*factor(Intervention) +
                            (1 | Image) +
                            (1 + Intervention | Subject),data = data01)

coef(summary(largest_lmer))
#                                            Estimate Std. Error   t value
# (Intercept)                              0.51415277 0.03503742 14.674389
# factor(Sex)Male                          0.04019813 0.03006458  1.337059
# factor(Intervention)Pre                  0.05123982 0.01830275  2.799569
# factor(Sex)Male:factor(Intervention)Pre -0.04238911 0.02509809 -1.688938

install.packages("emmeans")
library(emmeans)

largest_lmer_emm_Int <- emmeans(largest_lmer,~ factor(Sex) | factor(Intervention))
pairs(largest_lmer_emm_Int)
# Intervention = Post:
#  contrast      estimate     SE   df t.ratio p.value
#  Female - Male -0.04020 0.0301 57.3 -1.336  0.1867 
# 
# Intervention = Pre:
#  contrast      estimate     SE   df t.ratio p.value
#  Female - Male  0.00219 0.0307 57.2  0.071  0.9434 
# 
# degrees-of-freedom method: kenward-roger

largest_lmer_emm_Sex <- emmeans(largest_lmer,~ factor(Intervention) | factor(Sex))
pairs(largest_lmer_emm_Sex)
# Sex = Female:
#  contrast   estimate     SE   df t.ratio p.value
#  Post - Pre -0.05124 0.0184 56.5 -2.789  0.0072 **This is the significant simple effect**
# 
# Sex = Male:
#  contrast   estimate     SE   df t.ratio p.value
#  Post - Pre -0.00885 0.0172 55.0 -0.515  0.6084 
# 
# degrees-of-freedom method: kenward-roger

模型2 ：所有输出均与模型1相似（此处不再赘述）：

medium_lmer <- lmer(Prop ~ factor(Sex)*factor(Intervention) + 
                           (1 | Image) +
                           (1 | Subject) +
                           (1 | Intervention:Subject),data = data01)

模型3 ：所有输出均与模型1相似（此处不再赘述）：

smallest_lmer <- lmer(Prop ~ factor(Sex)*factor(Intervention) + 
                             (1 | Image) +
                             (1 | Subject),data = data01)

正如我提到的，这些候选模型的 all 全部给出了上面提到的测试统计数据-它们没有随所包含的随机效应而变化。满足模型的假设（正态性，均方差）。还有其他我想念的东西吗？还是在数学上可能没有什么相互作用，但是在其测试统计量/ p -值方面，显着的简单效果与这两者相差很大？ / p>

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

interaction lme4 mixed-models r r