[吃瓜教程]南瓜书第5章神经网络

最新推荐文章于 2025-08-04 22:34:22 发布

不是吧这都有重名

最新推荐文章于 2025-08-04 22:34:22 发布

阅读量943

点赞数 18

CC 4.0 BY-SA版权

分类专栏：西瓜书系列文章标签：神经网络人工智能深度学习

本文链接：https://blog.csdn.net/qq_41776136/article/details/140158773

1.M-P神经元

M-P神经元，全称为McCulloch-Pitts神经元，是一种数学模型，用于模拟生物神经元的功能。这个模型是由Warren McCulloch和Walter Pitts在1943年提出的。它是人工智能和计算神经科学领域中非常重要的早期模型。
M-P神经元接收n个输入（通常来自其他神经元），并给各个输入赋予权重计算加权和，然后和自身特有的阈值 $θ\theta$ 进行比较（作减法），最后经过激活函数（模拟“抑制”和“激活”）处理得到输出（通常是给下一个神经元）
$y=f(\sum_{i=1}^nw_ix_i-\theta)=f(w^Tx+b)$
单个M-P神经元：感知机（sgn作激活函数）、对数几率回归（sigmoid作激活函数）
多个M-P神经元：神经网路

2.感知机（分类模型）

2.1 sgn函数

sgn 函数，或称为符号函数（sign function）：是一个数学函数，用于确定一个实数的符号。sgn 函数的定义如下：

当x>0时，sgn(x)=1
当x=0时，sgn(x)=0
当x<0时，sgn(x)=-1
图像如下：

2.2 感知机

1）模型
其具体公式如下：
$y=sgn(w^Tw-\theta) =\begin{cases} 1& ,{w^Tx-\theta>= 0}\\ 0& ,{w^Tx-\theta<0} \end{cases}$
其中， $x∈RNx\in \mathbb{R}^N$ 为样本的特征向量，是感知机模型的输入， $w,θw,\theta$ 是感知机模型的参数， $w∈Rnw\in \mathbb{R}^n$ 为权重， $θ\theta$ 为阈值

从几何的角度来说，给定一个线性可分的数据集T，感知机的学习目标是求得能对数据集T中的正负样本完全正确划分的超平面，其中 $wTx−θw^Tx-\theta$ 即为超平面方程。
n维空间的超平面 $(wTx+b=0,其中w,x∈Rn)(w^Tx+b=0,其中w,x \in \mathbb R^n)$ :