PyCaret:分类分数与标签不一致

问题描述

我正在使用 PyCaret 2.3 处理二进制分类任务。

模型统计数据看起来很可靠,我可以使用此模型进行预测(例如准确度 = 0.9)

让我感到困惑的是生成的预测。似乎 score 和 Label 根本不对齐。

我希望按 score 对预测输出进行排序会显示最高 score 的 Label=1。然而,分数/标签无处不在。最高的 score 值的 Label 为 0。对于 Label=1,我看到 score 值的范围从 0.95 到 0.5007。 score一般在0.5003到0.997之间。

解决方法

Score 表示给定标签为真的概率。

即 Label=1 且 Score=0.7 表示 Label=1 的概率为 70%。反之亦然,Label=0 且 Score=0.9 表示 Label=0 的概率为 90%。

predict_model() 具有选项 raw_score=True。这将为您提供每个标签的所有概率。