问题描述
我运行了以下 Python 代码来解决我的数据不平衡问题。我使用了 SMOTE 功能。我不确定如何查看和导出(作为 excel 文件到我的桌面)“重新采样数据集”(1:860 到 0:860)。因为我想获取那个 excel 文件并使用另一个应用程序处理它。非常感谢任何帮助
from imblearn.over_sampling import SMOTE
smote = SMOTE()
x_smote,y_smote = smote.fit_sample(x,y)
print('Original dataset:',Counter(y))
print('Resample dataset:',Counter(y_smote)
原始数据集形状 Counter({1: 860,0: 483})
重采样数据集形状 Counter({1: 860,0: 860})
解决方法
变量 y
和 y_smote
是 dataFrame,因此要将它们转换为 .csv 使用
y.to_csv("file1.csv")
y_smote.to_csv("file2.csv")
在根目录中找到名为 file1.csv
和 file2.csv
的文件