对于不平衡的二元分类模型,我应该使用哪个指标?

问题描述

我在不平衡数据集上执行了 SVM,以 70/30 拆分训练/测试。训练集中的实例数为class 11163993class 0234190个实例。对于测试集,我有 498699class 1 实例和 100189class 0 实例。 SVM 的混淆矩阵如下所示:

我应该使用什么指标来评估模型?以这种方式使用 f-avg,计算每个类的精度、召回率和 f-1 分数可能是一种解决方案:

enter image description here

然后通过对每个班级计算的两个 f-1 分数的算术平均值计算 f-avg,如上表的最后一行所示?

解决方法

我假设您正在此处寻找概率评估指标。在我看来,使用 AUC-ROC(使用精度和召回率计算)将是正确的方法,实际上对于大多数二元分类问题。

另请参阅this article