回归算法（三）：Softmax回归

最新推荐文章于 2024-03-01 21:03:09 发布

原创最新推荐文章于 2024-03-01 21:03:09 发布 · 874 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #逻辑回归

机器学习专栏收录该内容

14 篇文章

订阅专栏

本文深入解析Softmax回归，一种用于解决多分类问题的算法。从推导Softmax函数到求解参数w，再到梯度下降法的应用，全面阐述了Softmax回归的工作原理。并讨论了其与逻辑回归的关系及多分类的其他方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

四、Softmax回归

解决多分类问题。

1. 换个思路推导出softmax函数

在《回归算法（二）：逻辑回归》中提到，P(yi=1|xi)依赖于exp(wxi)，用一个参数向量w来推测yi属于1的概率，exp(wxi)大则说明yi属于1的概率大，exp(wxi)小则说明yi属于1的概率小；只不过在二分类问题中，yi属于1的概率小，则yi不属于1，而属于另一类（yi=0）。但在多分类问题中，exp(wxi)小只能说明yi不属于1，但不知道yi属于其他哪一类。所以引入【多个】参数向量w预测该样本属于哪个类的概率。

w1用来预测yi属于1的概率，w2用来预测yi属于2的概率，w3用来预测yi属于3的概率

P∈（0，1），exp() ∈（0，+∞）。因此如何把exp()的值域变成（0，1），且要使得概率之和等于1。如何只是单纯地对每个exp(wjxi)变成sigmoid(wjxi)，确实可以解决 “把exp()的值域变成（0，1）”，也能预测多个类；但不能解决概率之和等于1，即可能会出现exp(w1xi)+exp(w2xi)大于1的结果。所以不采取这种方法。而是采用归一化的手段，于是有：