机器学习笔记 perceptron（感知机）在ex4Data数据集上的实现_感知机算法输入值可以是负数吗-CSDN博客

本文链接：https://blog.csdn.net/Avlon/article/details/82844711

本文介绍了在机器学习课程中，使用感知机模型对ex4Data数据集进行线性分类的实践。文章详细阐述了感知机模型的原理，包括损失函数、梯度下降优化方法（SGD与GD）以及参数更新规则。通过代码示例展示了模型的训练过程，同时探讨了优化策略，如仅在分类错误时更新参数。最后，对比了二分类与多分类感知机的区别，并展示了实际的分类结果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

惯例的ML课堂作业，第四个也是最后一个线性分类模型，感知机。

感知机是一个非常简单的线性分类模型，简单来说就是一个神经元，其激活函数是门限函数，有n个输入和一个输出，和神经元结构十分相似。

感知机的损失函数是看作是分类错的所有样本的输出值的和

hw的输出就是模型的预测结果，对于二分类问题就是0/1两种，y是真实标记。当预测和真实一致时，求和项为0，当hw取1，真实样本为0，系数为1。hw输入正值时才预测1所以整一项也是取正值，相反时系数为-1，但是输入值也是负数，最后还是正数。

损失函数形式很简单，对参数求导就可以得到梯度值。

对于SGD优化，参数更新规则如下：

由于数据是线性不可分的，SGD下会不断的震荡，用GD的话可以稳定结果，但是参数会不断扩大直到超出表示范围。GD就是把所有的SGD更新加起来而已。

下面给出代码：

import numpy as np
import matplotlib.pyplot as plt
import random

data_x = np.loadtxt("ex4Data/ex4x.dat")
data_y = np.loadtxt("ex4Data/ex4y.dat")
data_x_plt = data_x
plt.axis([15, 65, 40, 90])
plt.xlabel("exam 1 score")
plt.ylabel("exam 2 score")
for i in range(data_y.size):
    if data_y[i] == 1:
        plt.plot(data_x[i][0], data_x[i][1], 'b+')
    else:
        plt.plot(data_x[i][0], data_x[i][1], 'bo')
mean = data_x.mean(axis=0)
variance = data_x.std(axis