为矢量预测配置 SMOTE

问题描述

我正在处理多标签预测任务,其中标签被编码为单热编码向量,例如 [1,0][0,1,1] 类型 ndarray .

数据集不平衡。因此,我正在使用 SMOTE。这有效并对所有少数类进行上采样(它上采样与多数类持有的记录一样多)。

现在,我不想对尽可能多的记录进行上采样。根据 documentation,我可以使用 sampling_strategy 并提供带有 key = class labelvalue = total records 的字典。

但是,我无法将 ndarray 添加为我的 dict (TypeError: unhashable type: 'numpy.ndarray') 的键。这里最好的方法是什么? SMOTE 显然可以处理这些 one-hot 编码的向量——那么我如何在其中获取 total records

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)