问题描述
我正在使用模型来拟合不平衡的数据集。将数据集拆分为训练数据集和测试数据集后,我尝试使用两种方法训练模型:
-
使用原始训练数据集训练模型
-
使用过采样的训练数据集训练模型,使训练数据集平衡。
我根据测试数据集评估模型。
结果表明,测试数据集的召回值从 0.7 增加到 0.8。但精度-召回率曲线下的面积变化不大。
我能说这个模型可以容忍不平衡的数据集吗?
更新:我绘制了两种情况的精确召回曲线,曲线几乎相同。这是否意味着过采样不会改进模型?那么该模型可以容忍不平衡的数据集吗?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)