问题描述
我使用 SMOTE 对我的训练集进行过采样。在训练集中,除了数值特征外,每一行还有多个分类属性,例如位置和类型。当我使用 SMOTE 重新采样我的数据时,如何将这些分类属性的分布与训练集中的那些进行比较?在 imblearn 的过采样策略中,sample_indices_ 使这成为可能,但我认为这在 SMOTE 中是不可能的。有没有办法解决这个问题?我们也可以让 SMOTE 基于分类属性创建合成示例吗?例如,在少数类实例较少的位置创建少数类的样本?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)