如何计算R中两个数据集的显着差异?

问题描述

我有两个数值向量,每个向量显示我们需要完成不同任务的天数:a 使用新技术与 b 使用旧技术

a

b

我需要知道 a 和 b 之间是否存在显着差异?如果是,估计两组之间的差异幅度?

解决方法

如果您的值是正态分布的,您可以使用 R 的内置 t.test 函数。如果不是,您可以使用 wilcox.test 函数(不假设人口是如何分布的)。

您可能只需计算倍数变化的差异幅度。

t.test(a,b)
wilcox.test(a,b)

foldChange = mean(a)/mean(b)
,

假设样本组 a 和 b 都来自正态分布,您可以定义并测试两组均值是否存在显着差异,如下进行两个样本 t 检验。

注意,知道两个总体的方差是否相等会有所帮助,但这也在 t.test 函数的参数中解决:

t.test(a,b,alternative="two.side",var.equal=FALSE,conf.level=0.95)