问题描述
我以两种方式计算正态分布 cdf 的值:
- 使用 scipy 库:
from scipy.stats import multivariate_normal
from scipy.special import erf,erfc
sigma = 0.793387
one = multivariate_normal(1.0,sigma)
one.cdf(0.0)
输出:0.13078590311690458
- 手动计算
1.0 /2 * (1.0 + erf(-1.0 / np.sqrt(2) / sigma))
输出:0.10375913672098108
它们有很大的不同。
请你告诉我,哪里可能出错了?
UPD:当我使用 norm
中的 scipy.stats
时,它会显示手动计算的答案:
norm.cdf(0.0,1.0,sigma)
输出:0.10375913672098103
解决方法
multivariate_normal
的 Cdf 将协变矩阵作为参数,其中离散(但不是偏差)应位于对角线上。所以有一个正确的使用cdf的方法:
one = multivariate_normal(1.0,sigma * sigma)