问题描述
我刚刚尝试将对数正态分布的 scipy 输出与 wikipedia 上的公式相匹配。
我被困在具有下限的部分期望上。
如果我使用这个简单的对数正态分布:
k = .25
sigma = .5
mu = .1 # from the logged variable
lnorm = scist.lognorm(s=sigma,scale=np.exp(mu))
其中 k 是下限,
根据我的理解,部分期望由以下公式给出:
好的。所以我们只是在谈论对数正态分布的平均值和带有 z 分数的 CDF。 scipy 提供部分
lnorm.expect(lambda x:x,lb=k)
>>> 1.25199...
事实上,我们可以通过检查条件期望来确认这是部分。直接计算或使用上面的部分会产生相同的结果:
lnorm.expect(lambda x:x,lb=k) / (1 - lnorm.cdf(k))
>>> 1.25385...
lnorm.expect(lambda x:x,lb=k,conditional=True)
>>> 1.25385...
但是,scipy 的 cdf
函数采用 x
变量,而不是 z-score,我不确定如何转换它:
转化为 x
值。我尝试了很多不同的口味。
我会想:
可以解决当 scipy 的 cdf
(大概)在内部计算 z-score 时必须发生的 mu 减法。
我使用的任何公式最终都会得到一个非常小的值或 0。
任何帮助将不胜感激。
解决方法
IIUC,您可以简单地计算 (mu+sigma^2-ln(k))/2 中正态分布 N(0,1) 的 CDF,即
import numpy as np
import scipy.stats as sps
def partial_expectation(mu,sigma,k):
"""
Returns partial expectation given
mean,standard deviation and k.
https://en.wikipedia.org/wiki/Log-normal_distribution
"""
# compute cumulative density function
# of Normal distribution N(0,1) in x=x_phi
x_phi = (mu + sigma**2 - np.log(k))/sigma
phi = sps.norm.cdf(x_phi,loc=0,scale=1)
# mean of lognormal
lognorm_mu = np.exp(mu + .5*(sigma**2))
# result
return lognorm_mu * phi
k = .25
sigma = .5
mu = .1 # from the logged variable
lnorm = sps.lognorm(s=sigma,scale=np.exp(mu))
print('from def:',partial_expectation(mu,k))
print('from sps:',lnorm.expect(lb=k))
from def: 1.251999952174895
from sps: 1.2519999521748952