原始问题与对偶问题

最新推荐文章于 2024-11-10 13:17:53 发布

摆烂办不到

最新推荐文章于 2024-11-10 13:17:53 发布

阅读量1.3w

点赞数 5

CC 4.0 BY-SA版权

分类专栏： Machine learning 文章标签：优化对偶问题

本文链接：https://blog.csdn.net/wuyanxue/article/details/80039109

Machine learning 专栏收录该内容

28 篇文章

订阅专栏

最近在看支持向量机，对对偶问题不甚了解。就花了一些时间看了一下知乎上的解释和Andrew Ng的解释。以下是关于这个issue的总结。

假设我们有如下优化问题（原问题）

Problem 1:
$min⁡f(x)\min f(x)$
$s.t. g(x) \leq 0, $

为描述方便起见，我们假设只有一个不等式约束，多个不等式约束可以做简单的扩展。等式约束则可以转化为不等式约束。令

$\lambda) = f(x) + \lambda g(x)$ ，

很显然，如果

Problem 2:
$f (x) < v$
$\leq 0,$

无解，我们称 $v$ 是Problem 1的一个下界。如果Problem 2有解，那么对于任意的 $λ≥0\lambda \geq 0$ ,

Problem 3:
$\lambda) < v,$

有解（略微思索便知）。

显然地，根据逆否命题：如果Problem 3无解，那么Problem 2无解。

Problem 3无解的充分必要条件是

Problem 4:
$\leq \min_x L(x, \lambda)$ .

因此，如果Problem 4成立，则Problem 2无解，那么v是Problem 1的一个下界。

因为我们要找到一个最大下界，所以

$v∗=max⁡λmin⁡xL(x,λ)v^* = \max_\lambda \min_x L(x, \lambda)$ .

因此，也就引入了Dual problem.

说到这里，我们再来看一下原问题，
很显然，我们有如下公式
$\max_\lambda L(x, \lambda)= f(x), \text{ if } g(x) \leq 0; else \text{ } +\infty$

所以原问题即

Problem 5:
$p∗=min⁡xmax⁡λL(x,λ)p^* = \min_x \max_\lambda L(x, \lambda)$ .

我们看到，原问题与对偶问题实际上就是前面极小极大符号的交换。

针对该解释，我给出的直观的理解是：对偶问题是直接求解原问题转化成求原问题的最大下界的问题

原问题与对偶问题满足如下不等式关系,

$v∗=max⁡λmin⁡xL(x,λ)≤min⁡xmax⁡λL(x,λ)=p∗v^* = \max_\lambda \min_x L(x, \lambda) \leq \min_x \max_\lambda L(x, \lambda) = p^*$ .

当f(x)与g(x)都是convex的时候，我们有 $v^* = p^*$ ，原问题等价于对偶问题。这是因为当f(x)与g(x)是convex的时候，原问题与对偶问题的解都是独立于 $λ\lambda$ 的，具体地可以参见：

https://wenku.baidu.com/view/3d94c60f172ded630a1cb63d.html

补充：看西瓜书上对对偶问题的解释，觉得很透彻，现在复述一遍。

对于原始问题
$\text{ } f(x)$
$h_i(x) = 0, i = 1, \dots, m$
$gj(x)≤0,j=1,…,ng_j(x) \leq 0, j = 1, \dots, n$ .

构建Lagrange函数如下：
$\alpha, \beta) = f(x) + \alpha^Tg(x) + \beta^Th(x)$
其中 $α⪰0\alpha \succeq \mathbf{0}$ ，表示 $α\alpha$ 中每个分量都是大于0的。
其Lagrange对偶函数如下，其中 $D$ 表示可行域：
$L(x,α,β)\Gamma(\alpha, \beta) = inf_{x \in D} \text{ } L(x, \alpha, \beta)$
$inf_{x \in D} [f(x) + \alpha^Tg(x) + \beta^Th(x)]$

很显然，x在可行域范围之内，满足 $\leq 0$ 以及 $h (x) = 0$
那么 $αTg(x)+βTh(x)≤0\alpha^Tg(x) + \beta^Th(x) \leq 0$ 是成立的，因此：
假设 $x^*$ 是无约束函数 $f (x)$ 的最优解，那么有
$Γ(α,β)=infx∈DL(x,α,β)≤L(x∗,α,β)≤f(x∗)\Gamma(\alpha, \beta) = inf_{x \in D} L(x, \alpha, \beta) \leq L(x^*, \alpha, \beta) \leq f(x^*)$ 。
令 $f(x^*) = p^*$ 为最优值, 那么 $Γ(α,β)≤p∗\Gamma(\alpha, \beta) \leq p^*$
显然，这个下界取决于 $α,β\alpha, \beta$ 这两个变量，找到一个最好的下界便成为一个很自然的问题，因此引入对偶问题：