逻辑回归如何实现？

terryjoo

已于 2025-05-16 08:52:56 修改

阅读量366

点赞数 10

文章标签：逻辑回归 pytorch 深度学习 python

于 2025-05-15 11:19:34 首次发布

本文链接：https://blog.csdn.net/terryjoo/article/details/147978091

版权

逻辑回归：像医生做诊断一样分类

想象你是一位医生，要根据患者的 体检数据（如年龄、血压、血糖）判断他们是否患有某种疾病（患病=1，健康=0）。逻辑回归就像你的“诊断公式”：将各项指标加权求和后，通过一个“概率转换器”（Sigmoid函数）输出患病概率。

核心步骤

数据准备：收集患者的体检数据（特征）和诊断结果（标签）。
模型搭建：定义“诊断公式”（线性层 + Sigmoid）。
训练模型：通过不断调整权重，让预测结果逼近真实标签。
预测：对新患者数据输出患病概率。

我们用PyTorch实现逻辑回归

1. 数据准备

import torch
import torch.nn as nn
import matplotlib.pyplot as plt

# 生成模拟数据：100个样本，每个样本2个特征
X = torch.randn(100, 2)  # 体检数据（如年龄、血糖）
y = (X[:, 0] + 2*X[:, 1] > 0).float()  # 患病标签（简单线性决策边界）

# 可视化数据
plt.scatter(X[:, 0], X[:, 1], c=y, cmap='bwr')
plt.xlabel("Feature 1 (e.g., Age)")
plt.ylabel("Feature 2 (e.g., Blood Sugar)")
plt.title("Medical Diagnosis Data")
plt.show()

2. 定义模型

class LogisticRegression(nn.Module):
    def __init__(self, input_dim):
        super().__init__()
        self.linear = nn.Linear(input_dim, 1)  # 线性层
        self.sigmoid = nn.Sigmoid()            # 概率转换器
    
    def forward(self, x):
        return self.sigmoid(self.linear(x))    # 输出概率

model = LogisticRegression(input_dim=2)
print(model)  # 输出模型结构

3. 定义损失函数和优化器

criterion = nn.BCELoss()  # 二元交叉熵损失（用于二分类）
optimizer = torch.optim.SGD(model.parameters(), lr=0.1)

4.训练模型

epochs = 100
losses = []

for epoch in range(epochs):
    # 前向传播
    y_pred = model(X).squeeze()  # 压缩维度：[100,1] → [100]
    
    # 计算损失
    loss = criterion(y_pred, y)
    losses.append(loss.item())
    
    # 反向传播
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    
    # 每10轮打印损失
    if (epoch+1) % 10 == 0:
        print(f"Epoch {epoch+1}, Loss: {loss.item():.4f}")

# 绘制损失曲线
plt.plot(losses)
plt.xlabel("Epoch")
plt.ylabel("Loss")
plt.title("Training Loss")
plt.show()

5.模型评估

# 预测概率转类别（>0.5为患病）
with torch.no_grad():
    predictions = (model(X).squeeze() > 0.5).float()

# 计算准确率
accuracy = (predictions == y).float().mean()
print(f"Accuracy: {accuracy.item()*100:.2f}%")

期间我问了deepseek,AI告诉我中间一些需要注意的点，我觉得可以借鉴，我贴出来供大家参考：