召回率与准确率

最新推荐文章于 2025-06-25 10:17:00 发布

转载最新推荐文章于 2025-06-25 10:17:00 发布 · 3.4k 阅读

文章标签：

#数据挖掘 #搜索引擎 #query #互联网 #文档 #c

算法研究(数据挖掘、机器学习、自然语言、深度学习、搜索引擎) 专栏收录该内容

451 篇文章

订阅专栏

本文深入探讨了数据挖掘中预测和搜索引擎中常用的两个指标：召回率与准确率。通过具体示例，解释了如何在检索情况下区分和应用这两个概念，以及它们之间的相互制约关系。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

召回率和准确率是数据挖掘中预测、互联网中的搜索引擎等经常涉及的两个概念和指标。
召回率：Recall，又称“查全率”——还是查全率好记，也更能体现其实质意义。
准确率：Precision，又称“精度”、“正确率”。

以检索为例，可以把搜索情况用下图表示：

	相关	不相关
检索到	A	B
未检索到	C	D

A：检索到的，相关的                （搜到的也想要的）
B：检索到的，但是不相关的          （搜到的但没用的）
C：未检索到的，但却是相关的        （没搜到，然而实际上想要的）
D：未检索到的，也不相关的          （没搜到也没用的）

如果我们希望：被检索到的内容越多越好，这是追求“查全率”，即A/(A+C)，越大越好。
如果我们希望：检索到的文档中，真正想要的、也就是相关的越多越好，不相关的越少越好，这是追求“准确率”，即A/(A+B)，越大越好。

“召回率”与“准确率”虽然没有必然的关系（从上面公式中可以看到），在实际应用中，是相互制约的。要根据实际需求，找到一个平衡点。

往往难以迅速反应的是“召回率”。我想这与字面意思也有关系，从“召回”的字面意思不能直接看到其意义。“召回”在中文的意思是：把xx调回来。“召回率”对应的英文“recall”，recall除了有上面说到的“order sth to return”的意思之外，还有“remember”的意思。
Recall：the ability to remember sth. that you have learned or sth. that has happened in the past.
当我们问检索系统某一件事的所有细节时（输入检索query查询词），Recall指：检索系统能“回忆”起那些事的多少细节，通俗来讲就是“回忆的能力”。“能回忆起来的细节数” 除以 “系统知道这件事的所有细节”，就是“记忆率”，也就是recall——召回率。简单的，也可以理解为查全率。