问题描述
我正在尝试处理二元分类问题上的不平衡数据:
在拟合模型之前通过预处理来处理不平衡数据的三种方法是:
- 编辑最近的邻居
- 烟熏
- Tomek 链接
我想特别在二元分类问题中实现这些问题。我将如何在 R 中实现这些(我可以使用哪些包来解决二进制分类问题)?
我有一个使用 iris 数据集响应为 Species 的示例。
# Create unbalanced binary dataset (Remove 'versicolor')
data <- iris[-c(95:130),]
data <- data[data$Species == c("setosa","virginica"),]
# Show that data is imbalanced
table(data$Species) / sum(table(data$Species))
setosa versicolor virginica
0.7142857 0.0000000 0.2857143
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)