标签编码器和随机森林分类器的在线学习

问题描述

我有一个非常大的数据集需要用于分类，我对数据进行了采样，但这并不能保证我的输出中会有完整的标签。如何采样我的数据以覆盖所有标签？此外，我想保存在此过程中使用的 label encoder 和 RandomForestClassifier，以便将它们用于增量学习。我搜索了有关使用 RandomForestClassifier 的信息，我发现 set_warm 功能仅用于添加额外的估算器而不更新权重。并且 partial_fit 不支持使用随机森林。所以我的第二个问题是如何更新 label encoder 和 RandomForestClassifier 以训练另一个可能具有其他标签和更多数据点的数据集？

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

classification label-encoding online-machine-learning python random-forest