来自 ks_2samp 的 p 值是意外的

问题描述

为什么数组'x'和数组'y'之间的kstest的p值小于0.05?如您所见,它们实际上来自一种分布(即正态分布)。我找不到原因,我很困惑。提前谢谢您!

import scipy.stats as st
import numpy as np
np.random.seed(12)
x = np.random.normal(0,1,size=1000)
y = np.random.normal(0,size=1000)
st.ks_2samp(x,y)
Out[9]: KstestResult(statistic=0.066,pvalue=0.025633868930359294)

解决方法

这是正确的。请记住,p 值较低意味着您有理由拒绝原假设,即这两个样本来自相同的分布。但是拒绝零假设并不等于肯定这两个来自不同的分布,它只是意味着你不能断定它们来自相同的分布。