问题描述
我已经实施了 SMOTENC 来平衡具有 1 个分类变量的数据集。它已正确实施,但我无法对训练和测试数据进行拆分。下面是我实现的代码。有没有办法巧妙地做到这一点?
from imblearn.over_sampling import SMOTENC
smote_nc = SMOTENC(categorical_features=[0],random_state=0)
X_resampled,y_resampled = smote_nc.fit_resample(X,y)
X_train,X_test,y_train,y_test = train_test_split(X_resampled,y_resampled,test_size = 0.3,stratify = y,random_state = 42)
错误行是:'发现输入变量的样本数不一致:[224420,112431]'
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)