问题描述
示例:
- 是否需要平衡数据?
- 召回率比准确率更重要吗?
- 过采样通常比欠采样好吗?
再次感谢!
解决方法
这在很大程度上取决于所使用的数据类型、所训练的模型类型以及当前使用的超参数。 ROC 只是数据预处理和模型构建完成情况的结果。因此,您必须研究改进模型的方法。精确率和召回率也以它们自己的方式有用。这取决于场景。
喜欢precision
回答这个问题:
What proportions of the predicted True labels were actually correct ?
而 recall
回答:
What proportion of the actually correct labels were identified correctly ?
因此,在识别电晕患者的情况下,您希望获得更高的召回率,而当涉及到采取行动的成本高而不采取行动的成本低这一事实时,您希望获得更高的精确度。
此外,平衡数据的确切含义因情况而异。 因此,如果您能指定使用的模型、问题和数据的类型,我们可能会为您提供更多帮助。
请分享您的模型代码。