许多短组 - lmer 中的增长模型,其中估计了太多参数

问题描述

我正在查看对大约 10000 名儿童进行的纵向研究中的测试分数变量,该研究记录了三个波次(3,5 岁和 9 岁)。我有充分的理由相信截距和 score ~ Age 关系的斜率都有很大的变化。如果没有,那将是令人惊讶的。正如预期的那样,该分数随着年龄的增长而下降,而且正如预期的那样,它在早些年下降得更快,而在以后下降得更慢。这张表格说明了这一点。

Table: Mean and standard deviation of score by Age group
    
    Age score_mean  score_sd
    3   7.793276    4.562257
    5   7.190196    4.755098
    9   7.166542    5.384476

潜在增长曲线模型(未显示)证实了这一点。

我正在使用 lmer 来拟合随机截距、随机斜率模型。如果我将年龄编码为数字变量,并且确实确认随机斜率随机截距模型是合理的,那么这很好用,但是如果我按照自己的意愿将年龄编码为三级因子变量,则该模型拒绝拟合带有以下合理的消息:-

lmer5 <- lmer(data=LL,score ~ Age + (Age|ID))
Error: number of observations (=26804) <= number of random effects (=30450)
for term (Age + 1 | ID); the random-effects parameters and the residual
variance (or scale parameter) are probably unidentifiable

26804 是所有三个时间点数据中非缺失分数的总数。不确定 30450 来自哪里?

score 有 6,000 个左右的缺失值,因此作为一项实验,我制作了一个没有 score 缺失值的数据集,为此我得到了相同的错误消息,但两个数字是相同的。

所以,我认为我对 lmer 的调用是正确的,尽管如果不是,我会欢迎评论,但我看不到一种可理解的适应年龄的方式,除了线性效应,我和几代人远比较尊贵的前辈,认为不太可能是正确的。我认为这是一个统计问题,而不是 r 问题,但我接受它在边界上,所以我将它从交叉验证移到了这里。

欢迎所有建议。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)