l1 相比于 l2 为什么容易获得稀疏解？

sunghosts

于 2021-07-06 15:57:37 发布

阅读量232

点赞数 1

CC 4.0 BY-SA版权

分类专栏：算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sunghosts/article/details/118522669

机器学习同时被 2 个专栏收录

36 篇文章

订阅专栏

8 篇文章

订阅专栏

本文探讨了L2和L1正则化如何改变损失函数中的最优x值。L2使最优x保持非零，而L1在适当条件下可能导致零值稀疏。通过实例和导数分析，揭示了两者对参数稀疏性和极值点的不同影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

假设损失函数L和某个参数 x 的关系如图所示：

在这里插入图片描述

则最优的 x 在绿色点处， x 非零。

现在使用 L2 正则化，新的损失函数 $L+Cx^2$ 如图中蓝色线所示：（加了一个大于等于0的数字，图像变化）

在这里插入图片描述

最优的 x 点在黄色处，但 x 非零。

$f(x) = L+C x^2 \\ f'(x) = L' + 2Cx \\ f'(x)=0$

当导数等于0的时候，因为 $L^{'}$ 在x等于0时不等于0，因此x等于0时导数方向不变，即最优点不是0。

而如果使用L1正则化，则新的损失函数 $L + C ∣ x ∣$ ,图像如下

在这里插入图片描述

$\\ f'(x) = \begin{cases} L'-C,x<0 \\L'+C,x>0 \end{cases}. \\ f'(x)=0$

导数为0的时候，可知函数在x=0的两段导函数不同，即有可能存在导函数不同号的情况，即x=0的点是个极值点。

两种 regularization 能不能把最优的 x 变成 0，取决于原先的损失函数在 0 点处的导数。
如果本来导数不为 0，那么施加 L2 regularization 后导数依然不为 0，最优的 x 也不会变成 0。
而施加 L1 regularization 时，只要 regularization 项的系数 C 大于原先损失函数在 0 点处的导数的绝对值，x = 0 就会变成一个极小值点。

上面只分析了一个参数 x。事实上 L1 regularization 会使得许多参数的最优值变成 0，这样模型就稀疏了。

参考

https://www.zhihu.com/question/37096933

博客等级

码龄14年

150
原创

141
点赞

508
收藏

58
粉丝

关注

私信

热门文章

分类专栏

大数据 4篇
numpy，pandas，scipy，matplotlib 9篇
tensorflow，pytorch 9篇
NLP 37篇
机器学习 36篇
LeetCode 31篇
算法 8篇
读书
elasticsearch 2篇
可视化 1篇
数据结构 1篇
windows 4篇
数据库 10篇
linux 11篇
C/C++ 5篇
Lucene 2篇
设计模式 14篇
python 37篇
shell 5篇
JavaScript 4篇
HTML/CSS/XML 4篇
网络 6篇
Nginx 1篇
工具 9篇
maven 4篇
UML 1篇

展开全部收起

上一篇：: python requests post 请求

下一篇：: 堆排序--leecode

最新评论

hive 误删表恢复
穷苦书生_万事愁: 博主的CSDN博客文章"hive 误删表恢复"真的让我受益匪浅。在阅读这篇文章之后，我对这个主题有了全新的认识，而且博主对于细节的描写非常到位，展现出了博主的深厚功底。我期待着博主未来能够持续分享更多这样有价值的好文，同时也希望能够得到博主更多的指导，共同进步。感谢博主的分享和支持！
腾讯word2vec模型缩小版
qq_43624252: 我想问一下这些模型是不是不能进行增量训练了
Linux上部署Jupyter notebook
普通网友: 这篇文章是优质之作，内容充实，结构明晰，语言流畅且通俗易懂，适合广大读者阅读。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
pytorch加速-SDPA缩放的点乘注意力
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
【Conda】python进行离线环境迁移（用于配置相似的两台设备）
XYG.破绽: 请问如果没有虚拟环境，只有base环境，怎么进行迁移呢？

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。