为了最大化 auc_roc_score 需要注意哪些事项?

问题描述

改进我们的auc_roc_score有哪些提示和技巧

示例

  1. 是否需要平衡数据?
  2. 召回率比准确率更重要吗?
  3. 过采样通常比欠采样好吗?

再次感谢!

解决方法

这在很大程度上取决于所使用的数据类型、所训练的模型类型以及当前使用的超参数。 ROC 只是数据预处理和模型构建完成情况的结果。因此,您必须研究改进模型的方法。精确率和召回率也以它们自己的方式有用。这取决于场景。

喜欢precision回答这个问题:

What proportions of the predicted True labels were actually correct ?

recall 回答:

What proportion of the actually correct labels were identified correctly ?

因此,在识别电晕患者的情况下,您希望获得更高的召回率,而当涉及到采取行动的成本高而不采取行动的成本低这一事实时,您希望获得更高的精确度。

此外,平衡数据的确切含义因情况而异。 因此,如果您能指定使用的模型、问题和数据的类型,我们可能会为您提供更多帮助。

请分享您的模型代码。