hopeiagt

2020-05-29   阅读量: 832

Python数据分析 机器学习

为什么要在精准度和召回率间权衡?

扫码加入数据分析学习群

在解决分类问题时,经常会遇到样本不均衡的问题.分类模型更倾向于学习多数类样本的规律,而忽少数类的规律.因此,对于这类问题,仅参考准确率不能评价一个模型拟合的好坏程度的.从而提出了精确度(precision)和召回率(recall).

其中,精确度指的是准确率是对给定数据集,分类正确样本个数和总样本数的比值。即:

即它关注多数类.

召回率指的是召回率又被称为查全率,用来说明分类器中判定为真的正例占总正例的比率,即:

即关注少数类.

以新冠病毒为例,如果少找出一个携带病毒的患者,造成的损失是十分巨大的;如果判错一个未患病的患者,损失是可以接受的.因此,对于类似这样的问题,需要重点关注少数类的问题时,则要重点提高召回率.根据精确度和召回率此消彼长的关系,如果需要找出更多的少数类,则需要提高召回率,如果需要找出更多的多数类,则需要提高精确度.因此,需要根据业务逻辑,在处理分类问题时,需要对精确度和召回率进行权衡.

16.5017 1 5 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子