64-Precision-Recall的平衡

最新推荐文章于 2022-11-04 23:02:35 发布

原创最新推荐文章于 2022-11-04 23:02:35 发布 · 628 阅读

2 ·

CC 4.0 BY-SA版权

机器学习专栏收录该内容

89 篇文章

订阅专栏

本文探讨了在逻辑回归中如何通过调整阈值来平衡精准率和召回率，并通过实例展示了两者之间的相互制约关系。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Precision-Recall的平衡

上一篇博客介绍了在有一些场景我们可能更注重精准率，有一些场景可能更注重召回率。还有一些情况下，我们可能并不是特别偏向精准率和召回率，此时我们希望两者越大越好，此时我们就可以用 $F 1$ $S c o r e$ 这样的指标来综合精准率和召回率这两个指标。那么我们怎么同时使这两者都特别的大呢？其实这样的目标有可能是实现不了的，因为精准率和召回率之间是互相矛盾的指标。如果想要精准率提高，召回率就会不可避免地下降；想要召回率提高，精准率就不可避免地下降。我们要找到的是一个精准率和召回率之间的平衡。

之前我们学习逻辑回归算法时，提到了一个决策边界，当时我们的决策边界是：

在这里插入图片描述

如果我们的样本点在决策边界的一侧我们就将它们分类为 1，在决策边界的另一侧就将他们分类为 0。那么有的小伙伴就可能有疑问了，对于这条直线，我们为什么让它等于 0 呢？如果我设置任意一个常量 $t h r e s h o l d$ ，我们可不可以让 $t h r e s h o l d$ 作为决策边界呢？

在这里插入图片描述
如果 $θ^T·x_b$ 大于 $t h r e s h o l d$ 的话，我们就分类为 1，小于 $t h r e s h o l d$ 的话就将它分类为 0。这样其实也形成了一个决策边界。那么基于这样的想法，其实相当于为我们的逻辑回归算法引入了一个新的超参数。我们通过指定这个 $t h r e s h o l d$ 相当于平移我们的决策边界对应的这根直线从而影响分类结果。

下面我们就来看一下 $t h r e s h o l d$ 取不同的值将会怎样影响我们的分类结果？

我们用一个横轴代表 $θ^T·x_b$ 计算出来的值，为了不失一般性，我们将该轴取名为 $s c o r e$ 。我们在该轴上找到 0 这根直线，我们的回归算法就是以 0 作为阈值，如果 $s c o r e$ 大于 0，我们就将其分类为 1，如果 $s c o r e$ 小于 0，就将其分类为 0。