问题描述
我正在研究保险模型,我想使用 catboost 梯度提升算法运行严重性和频率模型。问题是,根据文献,严重性模型假设 Gamma 分布式响应变量,而根据 catboost 文档,不支持 Gamma 目标模型。有没有办法利用现有目标之一(例如 Poisson 或 Tweedie)来实现这一目标?
解决方法
是的,您可以将 Tweedie 分布的 variance_power
(文献中的p
符号)参数设置为 2 以获得 Gamma 分布。
示例:
CatBoostRegressor(loss_function='Tweedie:variance_power=2',n_estimators=500,silent=True)