为矢量预测配置 SMOTE

我正在处理多标签预测任务，其中标签被编码为单热编码向量，例如 [1,0] 或 [0,1,1] 类型 ndarray .

数据集不平衡。因此，我正在使用 SMOTE。这有效并对所有少数类进行上采样（它上采样与多数类持有的记录一样多）。

现在，我不想对尽可能多的记录进行上采样。根据 documentation，我可以使用 sampling_strategy 并提供带有 key = class label 和 value = total records 的字典。

但是，我无法将 ndarray 添加为我的 dict (TypeError: unhashable type: 'numpy.ndarray') 的键。这里最好的方法是什么？ SMOTE 显然可以处理这些 one-hot 编码的向量——那么我如何在其中获取 total records？

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）