用人话理解L1和L2正则化

最新推荐文章于 2021-09-24 08:38:48 发布

原创最新推荐文章于 2021-09-24 08:38:48 发布 · 289 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习

机器学习专栏收录该内容

14 篇文章

订阅专栏

本文深入探讨了范数的概念，它是衡量向量和矩阵大小的重要工具，源自绝对值概念的自然推广。特别地，文章详细解释了Lp范数，包括L1和L2范数，及其在数值分析中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

范数是什么

在实数域中，数的大小和两个数之间的距离是通过绝对值来度量的。在解析几何中，向量的大小和两个向量之差的大小是“长度”和“距离”的概念来度量的。为了对矩阵运算进行数值分析，我们需要对向量和矩阵的“大小”引进某种度量。即范数是具有“长度”概念的函数。范数是绝对值概念的自然推广。

Lp范数：L1范数：L2范数：

参考：

https://segmentfault.com/a/1190000019207682

https://blog.csdn.net/jinping_shi/article/details/52433975

https://cloud.tencent.com/developer/article/1433987

l1 相比于 l2 为什么容易获得稀疏解？ - 王赟 Maigo的回答 - 知乎 https://www.zhihu.com/question/37096933/answer/70426653

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Key_rongji

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

特征工程之特征选择

修炼之路

03-11

9475

一、为什么要做特征选择？如果一个模型在训练数据上的表现比在测试数据上要好很多，这就表示这个模型过拟合了。过拟合是指模型的参数对于训练数据的特定观测值拟合的非常接近，而训练数据的分布于真实数据的分布并不一致，所以模型具有较高的方差。产生过拟合的原因是因为，对于训练数据集上的模型过于复杂，通常我们可以通过以下几种方式来降低过拟合：1、收集更多的训练数据2、通过正则化引入罚项3、选择一个参数相对较少的简...

【AI面试】NMS 、 Soft NMS 、NMS Free 和 WBF 的辨析

钱多多先森

03-04

1243

nms算法汇总辨析

参与评论您还未登录，请先登录后发表或查看评论

机器学习中正则化项L1和L2的直观理解（转）

上帝是个娘们的博客

09-18

229

机器学习中正则化项L1和L2的直观理解

正则的详细讲解（一）

weixin_43499129的博客

03-31

4610

正则的详细讲解-正则介绍（一）正则介绍那么什么是正则？正则到低有什么用呢？正则匹配流程总结正则介绍那么什么是正则？说起正则，相信大部分小伙伴都听说过，有部分小伙伴还经常使用。正则表达式（英语：Regular Expression，在代码中常简写为regex、regexp或RE），正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。正则到低有什么用呢？咱们正常的登录功能，手机号登录，因为手机号的可能是移动、联调、电信，而且手机号数量很多，我们怎么去识别用户输入的是数字的，这时我们用

L1与L2正则化的总结

gongliming_的博客

03-29

287

(1)L1与L2正则化的定义 (2)为什么L1正则化用于稀疏矩阵，而L2正则化主要用于防止过拟合 https://blog.csdn.net/jinping_shi/article/details/52433975

使用xgboost以及lgbm

梦想闹钟

09-24

1968

xgboost: 这里列举的代码，是一个对10分类结果进行预测，max_depth参数控制树的深度，objective控制的是训练的目标，multi:softprob即多分类预测概率，num_class为需要分类的类数。这里输入的x的维度为n40000,输入的y的维度为n1,即y的每一行都是一个数字，0-9，代表所属的10分类 eval_metric这个参数指定的是训练的时候loss的类别。获得结果后，可以用predict方法获得分类的结果（1维标签，0-9），用predict_proba可以获得预测分类

用人话讲明白支持向量机SVM（下）

化简可得

07-20

304

文章目录4.求解超平面4.1几何间隔4.2凸二次规划4.3拉格朗日乘数法 4.求解超平面上篇仅介绍了SVM的基本概念，本篇着重讲解SVM中的最佳线性分类器（最大边界超平面）是如何求得的。 4.1几何间隔上一小节给出二维问题下最佳线性分割的标准，就是分割线到两类边界点的距离最“宽”，那么这个“宽度”怎么量化和求解呢？我们知道，点(x0,y0)(x_{0} ,y_{0})(x0,y0)...

七月在线机器学习笔试题错题记录1

qq_27318693的博客

06-21

575

解析：随机事件 X 所包含的信息量与其发生的概率有关。发生的概率越小，其信息量就越大；反之，必定发生的事件（如太阳东升西落），其信息量为 0。信息量公式：I(X) = −logp(X) ，其中 I 是 information 的缩写。信息量公式的单位： log 以2为底，记作lb，单位比特（bit） log 以e为底，记作ln，单位奈特（nat） log 以10为底，记作lg，单位哈...

互联网广告系统综述六模型

mytestmy的专栏

11-08

5302

互联网广告系统综述六模型经过几个博文的啰啰嗦嗦，又是业务又是定向又是系统架构的，给各位的感觉都是在描述一些外围的东西，真正核心的东西还没说到。对于心急得如干柴烈火的热血青年来说，似乎一直在各种前戏，一直没感受到提抢上阵的快感。就算这么急，这还是得说——在广告算法领域，如果说ctr预估是包子馅的话，前面那些东西就是包子皮，直接吃包子馅，不见得是很正确的吃法。下面就说说大家喜闻乐见的模型吧

【机器学习系列之二】逻辑回归（LR,Logistic Regression）

多元思考力

10-19

3790

起源模型原理 2.1 问题转换 2.2 损失函数-真实值与计算值的关系 2.3 参数求解方法-梯度下降法模型优化 3.1 过拟合于欠拟合 3.2 正则化 实践应用案例 4.1 微额借款用户人品预测大赛 4.2 使用sklearn包来实现总结引用 1.起源逻辑回归的起源分了好几个阶段，每个阶段都是前人经过漫长的研究，试验得来的，了解它是怎么来的，有助于理解如何把一个现实问题转

LGBMClassifier参数

starmoth的博客

11-28

2万+

1.boosting_type=‘gbdt’# 提升树的类型 gbdt,dart,goss,rf 2.num_leavel=32#树的最大叶子数，对比xgboost一般为2^(max_depth) 3.max_depth=-1#最大树的深度 4.learning_rate#学习率 5.n_estimators=10: 拟合的树的棵树，相当于训练轮数 6.subsample=1.0: 训练样本采样率...

LGBM调参方法学习

qq_34782535的博客

04-30

2万+

一、了解LGBM参数： LGBM是微软发布的轻量梯度提升机，最主要的特点是快，回归和分类树模型。使用LGBM首先需要查看其参数含义：微软官方github上的说明： https://github.com/Microsoft/LightGBM/blob/master/docs/Parameters.rst#early_stopping_round LGBM中文手册： http://lightgbm....

lgbm调参指南-记录

人生是一场修行

08-13

3114

基本调参思路，首先设置lr=0.1确定树的数量，然后调整每颗树的内部参数到最佳。确定树的内部参数后，用该参数，降低lr，反调lr和树的数量。参数介绍：参考：https://zhuanlan.zhihu.com/p/27916208

LGBM函数及参数详解

weixin_38267719的博客

04-02

2万+

LGBM Python API Dataset class lightgbm.Dataset(data, label=None, max_bin=None, reference=None, weight=None, group=None, init_score=None, silent=False, feature_name='auto', categorical_feature='auto'...

白话解释正则化原理

LEEANG121的博客

10-23

3109

白话解释正则化原理为什么要正则化如何正则化L1与L2正则化的区别为什么要正则化 我们在使用某个训练集训练机器学习模型的过程中，通常会计算在模型训练集上的损失函数来度量训练误差，损失越小，说明模型训练的越好。但是在实际情况中，我们不仅仅是要求模型在训练集上表现好，我们更希望的是模型在未得到训练的数据集上也有良好的表现，这种在未知的数据集上表现良好的能力称为泛化。我们当然希望泛化误差越小越好。但...

正则化的作用以及L1和L2正则化的区别

Lavi的专栏

08-21

3万+

0 正则化的作用 正则化的主要作用是防止过拟合，对模型添加正则化项可以限制模型的复杂度，使得模型在复杂度和性能达到平衡。常用的正则化方法有L1正则化和L2正则化。L1正则化和L2正则化可以看做是损失函数的惩罚项。所谓『惩罚』是指对损失函数中的某些参数做一些限制。 L1正则化的模型建叫做Lasso回归，使用L2正则化的模型叫做Ridge回归（岭回归。但是使用正则化来防止过拟合的原理是什么？L1和L...

LightGBM的参数详解以及如何调优

deephub

09-09

2万+

lightGBM可以用来解决大多数表格数据问题的算法。有很多很棒的功能，并且在kaggle这种该数据比赛中会经常使用。但我一直对了解哪些参数对性能的影响最大以及我应该如何调优lightGBM参数以最大限度地利用它很感兴趣。我想我应该做一些研究，了解更多关于lightGBM的参数…并分享我的旅程。我希望读完这篇文章后，你能回答以下问题: LightGBM中实现了哪些梯度增强方法，它们有什么区别? 一般来说，哪些参数是重要的? 哪些正则化参数需要调整? 如何调整lightGBM参数在python? .

Lightgbm如何处理类别特征？

anshuai_aw1的博客

10-22

3万+

本篇文章主要参考柯国霖大神在知乎上的回答，以及自己阅读LGBM的部分源码整理而来。 1、one-hot编码弊端 one-hot编码是处理类别特征的一个通用方法，然而在树模型中，这可能并不一定是一个好的方法，尤其当类别特征中类别个数很多的情况下。主要的问题是： ①可能无法在这个类别特征上进行切分（即浪费了这个特征）。使用one-hot编码的话，意味着在每一个决策节点上只能使用one vs re...

范数与距离的关系以及在机器学习中的应用