上周,2023年,我那个朋友问我召回率是什么意思。简单来说,召回率是评估分类模型性能的一个重要指标。它指的是模型正确识别出的正类样本占所有正类样本的比例。换句话说,就是模型把真正是“是”的判断为“是”的比例。这个指标通常用于二分类问题,比如垃圾邮件检测、欺诈检测等。
值得注意的是,召回率很高可能意味着误报率也高,即模型可能会把一些非正类样本错误地判断为正类。本质上,召回率关注的是模型的覆盖面,一言以蔽之,就是看模型能不能把大部分真正的“是”都找出来。每个人情况不同,具体使用时还要结合其他指标一起考虑。
上周有个客人问我这个问题。简单来说,召回率就是指在所有应该被识别出来的目标中,系统正确识别出来的比例。比如,你有一个邮件过滤系统,它本来应该把所有垃圾邮件都识别出来,那么召回率就是实际识别出的垃圾邮件数量除以所有垃圾邮件的总数。
举个例子,假设2023年我在上海某商场做了一次问卷调查,一共收到了1000份问卷,其中应该有300份是有效的,而系统正确识别出了其中的280份。那么这个系统的召回率就是280除以300,等于0.93,也就是93%。这个数字越高,说明系统的准确率越高。
不过,召回率并不是唯一衡量标准。有时候,我们可能更关注“精确度”,也就是正确识别非目标的比例。这两个指标有时候会冲突,所以要根据具体情况来决定哪个更重要。反正你看着办,我还在想这个问题呢。
召回率:找出的缺陷比例。 比如,我之前负责的项目,2020年,我们通过测试找出了100个缺陷,而实际存在的缺陷有200个,召回率就是50%。