吴恩达深度学习笔记(35)-加快归一化的网络训练方法

最新推荐文章于 2022-01-25 17:47:22 发布

极客Array

最新推荐文章于 2022-01-25 17:47:22 发布

阅读量589

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习吴恩达深度学习笔记文章标签：加快网络归一化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Harpoon_fly/article/details/85144763

归一化输入对于加速神经网络训练至关重要。通过零均值化和方差归一化，可以使得训练数据和测试数据具有相同的μ和σ^2，从而避免训练和测试数据的归一化差异。归一化有助于优化代价函数，使其更加对称，允许使用更大的学习率，从而提高训练效率。当特征值范围不同时，归一化尤为重要，因为它可以使不同特征处于相似的尺度，简化优化问题。即使特征值范围相近，归一化仍然是有益的。下节课将继续探讨更多加速训练的策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

归一化输入（Normalizing inputs）
训练神经网络，其中一个加速训练的方法就是归一化输入。假设一个训练集有两个特征，输入特征为2维，归一化需要两个步骤：

1.零均值
2.归一化方差；

我们希望无论是训练集和测试集都是通过相同的μ和σ^2定义的数据转换，这两个是由训练集得出来的。

在这里插入图片描述
第一步是零均值化

它是一个向量，x等于每个训练数据 x减去μ，意思是移动训练集，直到它完成零均值化。

在这里插入图片描述
第二步是归一化方差，

注意特征x_1的方差比特征x_2的方差要大得多，我们要做的是给σ赋值

这是节点y 的平方，σ^{2是一个向量，它的每个特征都有方差，注意，我们已经完成零值均化，(x}(i)^2元素y2就是方差，我们把所有数据除以向量σ^2，最后变成上图形式。

x_1和x_2的方差都等于1。

提示一下，如果你用它来调整训练数据，那么用相同的 μ 和 σ^2来归一化测试集。

尤其是，你不希望训练集和测试集的归一化有所不同，不论μ的值是什么，也不论σ^2的值是什么，这两个公式中都会用到它们。所以你要用同样的方法调整测试集，而不是在训练集和测试集上分别预估μ 和 σ^{2。因为我们希望不论是训练数据还是测试数据，都是通过相同}

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。