问题描述
我有一个非常大的数据集需要用于分类,我对数据进行了采样,但这并不能保证我的输出中会有完整的标签。如何采样我的数据以覆盖所有标签?
此外,我想保存在此过程中使用的 label encoder
和 RandomForestClassifier
,以便将它们用于增量学习。我搜索了有关使用 RandomForestClassifier
的信息,我发现 set_warm
功能仅用于添加额外的估算器而不更新权重。并且 partial_fit
不支持使用随机森林。所以我的第二个问题是如何更新 label encoder
和 RandomForestClassifier
以训练另一个可能具有其他标签和更多数据点的数据集?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)