问题描述
我正在使用 kaggle 的流失建模数据集 (https://www.kaggle.com/shrutimechlearn/churn-modelling),试图预测将要离开服务的客户。
初始数据集如下所示:
RowNumber CustomerId Surname Creditscore Geography Gender Age
0 1 15634602 Hargrave 619 France Female 42
整理数据后,数据集如下所示:
Creditscore Age Tenure Balance NumOfProducts HasCrCard IsActiveMember EstimatedSalary Germany Spain Male
0 619 42 2 0.00 1 1 1 101348.88 0 0 0
然后我拆分数据:
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.25,random_state = 0)
...拟合和预测模型:
from sklearn import svm
svm_model = svm.SVC()
svm_fit = svm_model.fit(X_train,y_train)
svm_prediction = svm_fit.predict(X_test)
... 并尝试交叉验证: 打印(metrics.confusion_matrix(y_test,svm_prediction))
但是混淆矩阵看起来像这样:
[[1991 0]
[ 509 0]]
为什么我得到 0 0 个假阳性和 0 个真阳性?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)