测试数据集的正态性

问题描述

我有一列包含 40 个样本的密度数据值,另一列包含样本编号;我想测试密度是否存在差异(p

此外,每当我使用 tapply 函数来测试此数据的正态性时,它都会说:

FUN(X[[i]],...) 中的错误:样本大小必须在 3 到 5000 之间。

我的所有数据值都低于 1,因为它是密度并且我有一种类型的样本(没有不同的类别),那么我将如何测试正态性以及我应该对此类数据进行哪些统计测试?

解决方法

我猜您正在使用 shapiro 测试,这在 R 中不适用于超过 5000 个元素的样本。

正如在这篇文章的评论中所提到的,经过 Stephane 的更正:

library(nortest)
lillie.test(test_vector) 

如果您的样本有重复,并且根据正态性检验的结果,我想是的,ANOVA 或 KW 看起来不错

希望能帮到你