问题描述
我已经阅读了许多帖子(例如 this one 和 this one),其中作者模拟了集群数据(一些代理 $n$ 跨集群 $c$ 分配,错误在集群但不是集群之间)由sampling from a multivariate normal distribution。
但后来我看到像 this one 这样的帖子,其中作者指定了一个 ICC 并通过从单变量法线中绘制来创建聚类数据。 fabricatr package simulates clustered data也是如此。
因此,即使聚类数据被正式定义为从多元分布中抽取,是否真的有必要从多变量中模拟抽取,或者您可以仅从单变量中进行模拟,如下所示:
n = 1000
c = 50
df = data.frame(
agent = 1:n,cluster = rep(1:c,each = n/c)
)
df$x = df$u_i = rnorm(n = n,mean = 0,sd = 1)
df$u_c = rep(rnorm(c,sd = 10),each = n/c)
df$y = 1 + 5*(df$x + df$u_c) + (df$u_c + df$u_i)
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)