【机器学习】CNN的数学基础

鑫宝Code

于 2024-08-20 10:08:01 发布

阅读量914

点赞数 90

分类专栏：机器学习文章标签：机器学习 cnn 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44214428/article/details/141089132

版权

鑫宝Code

🌈个人主页: 鑫宝Code
🔥热门专栏: 闲话杂谈｜炫酷HTML | JavaScript基础
💫个人格言: "如无必要，勿增实体"

文章目录

CNN的数学基础

CNN的数学基础

1. 引言

卷积神经网络（Convolutional Neural Network，CNN）作为深度学习中的重要模型，其强大性能背后蕴含着丰富的数学原理。本文将深入探讨CNN的数学基础，包括卷积运算、激活函数、池化操作、反向传播算法以及优化方法等核心概念。通过对这些数学基础的理解，我们可以更好地把握CNN的本质，为进一步优化和创新CNN模型奠定基础。
在这里插入图片描述

2. 卷积运算

2.1 连续卷积

在数学中，连续函数的卷积定义如下：

$\int_{-\infty}^{\infty} f(\tau)g(t-\tau)d\tau$

其中， $f$ 和 $g$ 是两个可积函数， $*$ 表示卷积操作。

2.2 离散卷积

在CNN中，我们主要关注离散卷积。对于二维离散卷积，其定义为：

$\sum_{m}\sum_{n} I(m,n)K(i-m,j-n)$

其中， $I$ 是输入（如图像）， $K$ 是卷积核（或称滤波器）。

2.3 互相关

实际上，CNN中使用的"卷积"操作更准确地说是互相关（cross-correlation）：

$\star K)(i,j) = \sum_{m}\sum_{n} I(i+m,j+n)K(m,n)$

这里 $\star$ 表示互相关操作。与真正的卷积相比，互相关不需要将卷积核翻转。

在这里插入图片描述

3. 激活函数

激活函数为神经网络引入非线性，增强模型的表达能力。

3.1 ReLU (Rectified Linear Unit)

ReLU是目前最常用的激活函数之一：

$\max(0, x)$

其导数为：

$\begin{cases} 1, & \text{if } x > 0 \\ 0, & \text{if } x \leq 0 \end{cases}$

3.2 Sigmoid

Sigmoid函数将输入映射到(0, 1)区间：

$\sigma(x) = \frac{1}{1 + e^{-x}}$

其导数为：

$\sigma'(x) = \sigma(x)(1 - \sigma(x))$

3.3 Tanh

Tanh函数将输入映射到(-1, 1)区间：

$\tanh(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}}$

其导数为：

$tanh'(x) = 1 - \tanh^2(x)$

最低0.47元/天解锁文章

评论 163

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

鑫宝Code 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。