如何在某些属性方面比较 SMOTE 生成的重采样数据与原始训练数据?

问题描述

我使用 SMOTE 对我的训练集进行过采样。在训练集中,除了数值特征外,每一行还有多个分类属性,例如位置和类型。当我使用 SMOTE 重新采样我的数据时,如何将这些分类属性的分布与训练集中的那些进行比较?在 imblearn 的过采样策略中,sample_indices_ 使这成为可能,但我认为这在 SMOTE 中是不可能的。有没有办法解决这个问题?我们也可以让 SMOTE 基于分类属性创建合成示例吗?例如,在少数类实例较少的位置创建少数类的样本?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)