逻辑回归-为什么逻辑回归predict_proba返回结果按行求和为1

最新推荐文章于 2024-01-20 17:35:50 发布

return bool(1)

最新推荐文章于 2024-01-20 17:35:50 发布

阅读量634

点赞数

CC 4.0 BY-SA版权

分类专栏： return bool(1)的笔记（该系列文章不一定正确！）文章标签：逻辑回归人工智能

本文链接：https://blog.csdn.net/liu20020918zz/article/details/128692016

本文探讨了逻辑回归的predict_proba方法在多分类问题中的工作原理。当multi_class设置为'multinomial'时，使用softmax函数预测各类概率；而设置为'ovr'时，对每个类别单独建模并归一化。通过load_iris数据集举例，解释了在不同设置下模型如何处理概率估计，以及为何输出的概率按行求和为1。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这里可以看一下帮助文档中的描述
predict_proba(X)

Probability estimates.
概率估计

The returned estimates for all classes are ordered by the label of classes.
这个方法的返回所有类别的概率的估计值按照类别的标签排序

For a multi_class problem, if multi_class is set to be “multinomial” the softmax function is used to find the predicted probability of each class. Else use a one-vs-rest approach, i.e calculate the probability of each class assuming it to be positive using the logistic function. and normalize these values across all the classes.
对于一个多分类问题，如果multi_clas桉树被设置为“multinomial” ，则softmax函数会被用于预测每个类别的预测概率。否则，使用ovr方法，即使用sigmoid函数，依次假设每个类为唯一正类，计算每个类别的概率，然后对所有类预测的概率进行归一化

这里我们以load_iris数据集为例，这是一个三分类数据集

from sklearn.datasets import load_iris
import numpy as np

X,y = load_iris(return_X_y=True)

逻辑回归的multi_class没有’ovo’选项

这里我们先说’ovr’情况，建立多分类情况下的模型

from sklearn.linear_model import LogisticRegression

clf = LogisticRegression(max_iter=1000,multi_class='ovr').fit(X,y)
clf.predict_proba(X[:5,:])
---
array([[8.96807569e-01, 1.03191359e-01, 1.07219602e-06],
       [7.78979389e-01, 2.21019299e-01, 1.31168933e-06],
       [8.34864184e-01, 1.65134802e-01, 1.01485082e-06],
       [7.90001986e-01, 2.09996107e-01, 1.90723705e-06],
       [9.12050403e-01, 8.79485212e-02, 1.07537143e-06]])