您是否必须从多元正态模拟聚类数据?

问题描述

我已经阅读了许多帖子(例如 this onethis one),其中作者模拟了集群数据(一些代理 $n$ 跨集群 $c$ 分配,错误在集群但不是集群之间)由sampling from a multivariate normal distribution

但后来我看到像 this one 这样的帖子,其中作者指定了一个 ICC 并通过从单变量法线中绘制来创建聚类数据。 fabricatr package simulates clustered data也是如此。

因此,即使聚类数据被正式定义为从多元分布中抽取,是否真的有必要从多变量中模拟抽取,或者您可以仅从单变量中进行模拟,如下所示:

  n = 1000
  c = 50
  df = data.frame(
    agent = 1:n,cluster = rep(1:c,each = n/c)
  )
  df$x = df$u_i = rnorm(n = n,mean = 0,sd = 1)
  df$u_c = rep(rnorm(c,sd = 10),each = n/c)
  df$y = 1 + 5*(df$x + df$u_c) + (df$u_c + df$u_i)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...