在 r 中实施编辑的最近邻居、smote 和 tomek 链接?

问题描述

我正在尝试处理二元分类问题上的不平衡数据:

在拟合模型之前通过预处理来处理不平衡数据的三种方法是:

  1. 编辑最近的邻居
  2. 烟熏
  3. Tomek 链接

我想特别在二元分类问题中实现这些问题。我将如何在 R 中实现这些(我可以使用哪些包来解决二进制分类问题)?

我有一个使用 iris 数据集响应为 Species 的示例。

 # Create unbalanced binary dataset (Remove 'versicolor')
 data <- iris[-c(95:130),]
 data <- data[data$Species == c("setosa","virginica"),]
 
 
 # Show that data is imbalanced
 table(data$Species) / sum(table(data$Species))

    setosa versicolor  virginica 
 0.7142857  0.0000000  0.2857143 

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)