R中SVM概率的信用评分

问题描述

我正在尝试为R中的Germancredit数据帧计算信用评分。我使用线性SVM分类器来预测0和1(即0 =良好,1 =不良)。

我设法使用以下代码从SVM分类器中产生了概率。

final_pred = predict(classifier,newdata = data_treated[1:npredictors],decision.values = TRUE,probability = TRUE)

probs = attr(final_pred,"probabilities")

我想知道如何读取这些概率输出。示例输出在这里。 以下输出是否表示,如果预测在第五行中为1(认),则概率为0.53601166。

              0          1 Prediction
1    0.90312125 0.09687875 0
2    0.57899408 0.42100592 0
3    0.93079172 0.06920828 0
4    0.76600082 0.23399918 0
5    0.46398834 0.53601166 1

然后我可以像上述通常使用logistic回归模型那样使用上述各个概率来开发信用计分卡吗?

解决方法

您将得出结果0或1的概率。每行的前两列总和为1,并为您提供总体概率。您的解释对我来说似乎是正确的,即,发生概率为0.53的情况比发生概率为p = 0.46的情况没有发生违约的可能性更大。

是的,您可以使用该模型来开发信用计分卡。请注意,确定公司或X人是否将默认为默认值时,您不必使用0.5作为截止值。