如何测试问卷答案从 0 到 10 的显着性

问题描述

我目前正在生成一个带有随机数的面板数据集。我模拟了一个问卷,其中“人们”可以按 0 到 10 的等级回答,其中 10 是最好的。创建数据很麻烦。我用它来获得答案,我假设平均答案约为 7。

变量

现在在面板数据中,我想在后期创建波动,这也不是太难,只要改变概率参数,然后将它们与历史平均值进行比较,以推断幸福感的变化是否具有统计差异。

所以我的问题是:在真实场景中我假设进行什么测试?由于人们只能回答 0 到 10,因此它并不是真正的正态分布,但是我可以选择 n 非常高。 T 检验?那么置信区间呢?

我知道数据不是连续的,并且 6.942 的平均值不存在,因为它没有定义。我忽略了这一点,因为我的决定是基于我读过的一篇论文。出于简化目的,他们选择将分数视为连续变量。我在其他线程中读到有非常复杂的方法来评估这种东西。然后,该论文显示了图表,其中某些事件引发了具有统计显着性的幸福感下降,但我所拥有的版本没有详细说明它们如何进行显着性检验。

非常感谢任何帮助!

解决方法

您想从测试中了解什么,例如。你问的具体问题是什么?如果平均值不同 ?

也许 Mann-Whitney U 测试 就足够了,如果您觉得均值对您没有真正的价值?它回答了一个略有不同的问题:“您是否希望一个总体的值高于另一个”,这听起来仍然适用于您的情况。


set.seed( 100 )
n <- 50
ref.data <- rbinom(n,10,0.70)
new.data <- rbinom(n,0.60)
wilcox.test( ref.data,new.data,paired=FALSE )