机器学习之感知器学习算法原理及公式推导

最新推荐文章于 2023-12-21 10:51:56 发布

MathManiac

最新推荐文章于 2023-12-21 10:51:56 发布

阅读量263

点赞数

CC 4.0 BY-SA版权

文章标签：机器学习算法学习

本文链接：https://blog.csdn.net/qq_52554169/article/details/130888793

Perceptron算法是一种用于线性可分样本的分类方法，通过寻找一个超平面来划分两类数据。它基于神经元模型，利用权重和阈值对输入进行加权求和并比较阈值来决定输出。当样本误分类时，权重会进行调整以逐步优化分类效果。损失函数表示为被错分样本的数量，但非连续性使得直接优化困难。文章讨论了损失函数的另一种形式，当样本被错分时，损失为负的内积，目标是找到使损失最小化的权重向量。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Perceptron Learning Algorithm

一、条件

样本集线性可分

二、原理

寻找一个超平面/直线将两类样本分开

$,xid)=sign(∑j=1dwjxij−θ)h(x_{i1},x_{i2},\cdots,x_{id}) = \text{sign}(\sum\limits_{j=1}^d w_jx_{ij} -\theta)$ , $,ni=1,2,\cdots,n$

$w_j$ 可看成生物神经元的权重， $x_{ij}$ 可看成生物神经元的刺激， $θ\theta$ 为阈值。当 $∑j=1dwjxij>θ\sum\limits_{j=1}^d w_jx_{ij}>\theta$ 时神经元兴奋， $∑j=1dwjxij<θ\sum\limits_{j=1}^d w_jx_{ij} <\theta$ 时神经元抑制。因此该方法称为感知器学习算法

令 $x_{i0}=1$ , $w0=θw_0=\theta$ , $1,2,\cdots,n$ 即 $x⃗i=[1xi1xi2⋯xin]T\vec x_i = \begin{bmatrix} 1&x_{i1}&x_{i2}&\cdots&x_{in} \end{bmatrix}^T$ , $w⃗=[θw1w2⋯wn]T\vec w = \begin{bmatrix} \theta&w_1&w_2&\cdots&w_n \end{bmatrix}^T$ 则 $h(x⃗i)=sign(w⃗T⋅x⃗i)h(\vec x_i)=\text{sign}(\vec w^T\cdot\vec x_i)$

构造损失函数
1. $\sum\limits_{i=1}^n\mathbb{I}(h(\vec x_i) \neq y_i)$
  
  即当前假设下被错分样本的个数，但此函数不连续，难以用数学方法求最优值
2. $L(w⃗)=−∑x⃗∈yw⃗T⋅x⃗L(\vec w) = -\sum\limits_{\vec x\in}y\vec w^T \cdot\vec x$
  
  当样本被错分时， $y$ 与 $w⃗T⋅x⃗\vec w^T\cdot\vec x$ 异号
求损失函数取最小值 0 时对应的假设 $h$