支持向量机(SVM)原理详解-CSDN博客

本文链接：https://blog.csdn.net/IBelieve2016/article/details/88750887

本文详细介绍了支持向量机（SVM）的基本原理，包括最大化间隔概念、拉格朗日对偶问题、KKT条件以及SMO算法。SVM旨在找到能最大化类别间隔的超平面，并通过拉格朗日乘子法处理约束条件，通过KKT条件确保等价性。文章还提及了核函数在SVM中的应用以及软间隔的概念，允许模型在部分样本上容忍错误，以提高泛化能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

唐老板的高级机器学习课上讲了SVM的原理，对支持向量机的推导和原理又加深了理解。

最大化间隔

支持向量机就是希望超平面能距离两个类别点尽可能的远，也就是最大化间隔的思想。

前面就不说了，目标函数就是最大化“超平面到两部分支持向量距离之和”，也就是左上角的式子，也相当于最小化其倒数。

而γ可以通过改变w的值而约掉，所以没有意义，这种损失函数（Lasso loss function）及约束条件最终变成了下图的最下面。

然后我们可以将上面的优化问题写成拉格朗日形式。那为什么可以这样写呢，以及后续再怎么利用对偶理论呢？接下来做些数学上的说明。

拉格朗日对偶

按着下面的截图，先来看一个基础的优化问题：

要最小化f(x)，包含不等式约束g(x)和等式约束h(x)。然后我们定义一个L(x, α，β）函数如下所示，它的约束条件只有α。

然后再考虑θ(x) = max L(x, α，β）。如果有些变量x不满足g(x)的不等式约束或h(x)的等式约束，那么θ(x)就是无穷大，因此，θ（x）可以写成下图的分段函数形式。现在我们再min θ（x），那么根据分段函数来看，其实就等价于原优化问题min f(x)。这样我们就把原来的优化问题用min max问题来表示了出来（注意min max各自下面的自变量）。

接着，我们来推导上图min max优化的对偶形式。对偶形式也就是写成max min的形式。那么为什么可以这样写呢？

通过简单的推导，我们可以证明max min L <= min max L。如果它能满足某些特定的条件（KKT条件，下文再讲），就可以取等号，也就是可以把上图的min max目标函数写成max min的目标函数形式。这就是拉格朗日的对偶形式，但是对于我们的SVM优化目标还没有结束。

求解对偶问题

先把目前为止的思路梳理一下，首先是一个min优化问题，有一个不等式约束条件，然后将其写成拉格朗日形式，然后等价地写成min max形式，如果满足KKT条件，我们就可以写成max min的形式。写成了max min形式后，我们先求解内层的min L(w, b, α)。由于要求最小值，我们可以求对w，对b的偏导，让他们等于0。这样就得到了右图的两个等式。