问题描述
我找不到关于 StdErr
列在预测 H2OFrame
中代表什么的任何文档,您从 predict
方法获得 H2OGeneralizedLinearEstimator
。我希望它是预测的标准误差,但是当我用对数链接拟合花呢 GLM 时,这些值太小了。我怀疑 stderr
是线性预测器的预测标准误差,它只需要取幂,但同样,我找不到任何关于它是什么的文档。
import h2o
import numpy as np
h2o.init()
# create fake data
freq = np.random.binomial(1,.3,100)
severity = np.random.gamma(1,1000,100)
loss = freq*severity
e = np.random.normal(0,30,100)
predictor = severity + e
hf = h2o.H2OFrame({
"predictor": list(predictor),"loss": list(loss)
})
# define and train tweedie model
model = h2o.estimators.H2OGeneralizedLinearEstimator(
family="Tweedie",tweedie_link_power=0,tweedie_variance_power=1.5,standardize=False,Lambda=0,compute_p_values=True,response_column="loss"
)
model.train(
x=["predictor"],y="loss",training_frame=hf
)
然后模型预测如下表所示。即使有这些虚构的数据,预测误差似乎也不太可能如此之小。
model.predict(hf)
预测 | StdErr |
---|---|
105.352 | 0.285071 |
221.748 | 0.17843 |
138.956 | 0.236532 |
173.803 | 0.203677 |
632.556 | 0.250724 |
130.473 | 0.246953 |
150.317 | 0.22418 |
300.163 | 0.169437 |
123.861 | 0.255866 |
112.778 | 0.272533 |
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)