问题描述
我正在处理多标签预测任务,其中标签被编码为单热编码向量,例如 [1,0]
或 [0,1,1]
类型 ndarray
.
数据集不平衡。因此,我正在使用 SMOTE。这有效并对所有少数类进行上采样(它上采样与多数类持有的记录一样多)。
现在,我不想对尽可能多的记录进行上采样。根据 documentation,我可以使用 sampling_strategy
并提供带有 key = class label
和 value = total records
的字典。
但是,我无法将 ndarray
添加为我的 dict (TypeError: unhashable type: 'numpy.ndarray'
) 的键。这里最好的方法是什么? SMOTE 显然可以处理这些 one-hot 编码的向量——那么我如何在其中获取 total records
?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)