DW李宏毅机器学习笔记--Task02-回归_datawhale李宏毅机器学习 task2学习笔记-CSDN博客

本文介绍了机器学习中的线性回归模型，包括一元和多元线性模型，通过损失函数评估模型性能，并利用梯度下降法寻找最优模型。文章探讨了过拟合现象及正则化的解决办法，强调了特征选择和模型复杂度对结果的影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

这是我在Datawhale组队学习李宏毅机器学习的记录，既作为我学习过程中的一些记录，也供同好们一起交流研究，此后还会继续更新相关内容的博客。

回归定义

回归（Regression）就是找到一个函数，通过输入特征值，输出一个数值 Scalar。

模型步骤

step1：模型假设，选择模型框架（线性模型）

step2：模型评估，如何判断众多模型的好坏（损失函数）

step3：模型优化，如何筛选最优的模型（梯度下降）

Step 1：模型假设 - 线性模型

一元线性模型（单个特征）

以一个特征x为例，线性模型假设为y=b+w*x。通过对b和w赋不同的值获得不同的模型。

多元线性模型（多个特征）

在实际应用中，输入特征肯定不止 x这一个，而是有多种特征。
在这里插入图片描述
小结：在模型假设中，应该根据已有数据的丰富度来决定是选取一元线性模型还是多元线性模型。

Step 2：模型评估 - 损失函数

【单个特征】: $x^1$
模型示例
这里定义 $x^1$ 是进化前的CP值， $\hat{y}^1$ 进化后的CP值， $\hat{}$ 所代表的是真实值
在这里插入图片描述

将10组原始数据在二维图中展示，图中的每一个点 $(x_{cp}^n,\hat{y}^n)$ 对应着进化前的CP值和进化后的CP值。

如何判断众多模型的好坏

有了这些真实的数据，那我们怎么衡量模型的好坏呢？从数学的角度来讲，我们使用距离。求【进化后的CP值】与【模型预测的CP值】差，来判定模型的好坏。也就是使用损失函数（Loss function）来衡量模型的好坏，统计10组原始数据 $\left ( \hat{y}^n - f(x_{cp}^n) \right )^2$ 的和，和越小模型越好。如下图所示：
在这里插入图片描述
上图最终简化成这种式子：
$\begin{aligned} L(f) & = \sum_{n=1}^{10}\left ( \hat{y}^n - f(x_{cp}^n) \right )^2，将【f(x) = y】, 【y= b + w·x_{cp}】代入 \ & = \sum_{n=1}^{10}\left ( \hat{y}^n - (b + w·x_{cp}) \right )^2\ \end{aligned}$

最终定义损失函数 Loss function： $\sum_{n=1}^{10}\left ( \hat{y}^n - (b + w·x_{cp}) \right )^2$

我们将 $w$ , $b$ 在二维坐标图中展示，如图所示：
在这里插入图片描述

图中每一个点代表着一个模型对应的 $w$ 和 $b$
颜色越深代表模型更优
可以与后面的图11（等高线）进行对比

Step 3：最佳模型 - 梯度下降

【单个特征】: $x_{cp}$
如何筛选最优的模型（参数w，b）
已知损失函数是 $\sum_{n=1}^{10}\left ( \hat{y}^n - (b + w·x_{cp}) \right )^2$ ，需要找到一个令结果最小的 $f^*$ ，在实际的场景中，我们遇到的参数肯定不止 $w$ , $b$ 。