如何在sklearn的HistGradientBoostingClassifier中构造直方图以确定最佳分割点

问题描述

lightgbm和sklearn的HistGradientBoostingClassifier估算器都使用直方图来确定连续要素的最佳分割。

是否可以直观地(或通过一些示例)说明直方图的创建过程,以及它如何帮助确定节点上更快的分割点。

我已经在Internet上广泛寻找答案,但是找不到任何简单或直观的方式来构建直方图。

解决方法

我不确定,但这可能与XGBoost中如何构造(唯一)回归树有关。对于连续功能,您可以构建直方图,确定分割(例如体重

我想sklearn的HistGradientBoostingClassifier可能也涉及上述工具优化,以得出最佳分割效果。