Python深度学习项目：CNN手写数字识别测试准确率_高准确率数字识别python资源-CSDN下载

共21个文件

png：5个

xml：4个

gz：4个

版权申诉

python

深度学习

123 浏览量 2024-05-04 22:43:47 上传评论收藏 22.16MB ZIP 举报

在本项目中，我们探索了如何使用Python进行深度学习，特别是通过卷积神经网络（CNN）来识别手写数字。这个任务是基于经典的MNIST数据集，它包含大量的手写数字图片，是许多机器学习和深度学习教程的首选示例。 **MNIST数据集** MNIST数据集是一个广泛使用的数据库，包含60,000个训练样本和10,000个测试样本。每个样本都是28x28像素的灰度图像，代表了一个0到9的手写数字。这个数据集被用来评估各种图像分类算法的性能。 **卷积神经网络（CNN）** CNN是一种特别适合处理图像数据的神经网络架构。它通过卷积层、池化层和全连接层来学习图像特征，从而实现识别任务。在这个项目中，CNN首先会学习到手写数字的边缘、形状等低级特征，然后逐渐学习到更复杂的结构，直到能够识别出数字。 **训练过程** 在训练CNN模型时，我们会使用训练集对模型进行迭代优化，通过反向传播和梯度下降算法更新权重，以最小化损失函数。损失函数通常是交叉熵损失，它衡量了模型预测的概率分布与真实标签之间的差异。 **测试准确率** 测试准确率是衡量模型性能的关键指标，它表示模型在未见过的测试数据上的表现。在这个项目中，CNN模型在测试集上的准确率达到了98%以上，这表明模型有很强的泛化能力，能很好地处理新数据。 **绘制图像** 在训练过程中，我们通常会绘制训练损失和测试准确率随时间变化的图像，以观察模型的收敛情况。这些图像可以帮助我们识别过拟合或欠拟合现象，以及调整超参数。 **混淆矩阵** 混淆矩阵是一种可视化工具，用于展示模型预测结果的详细情况。它可以清楚地显示出模型在每个类别的预测效果，例如真正例、假正例、真负例和假负例的数量。通过混淆矩阵，我们可以发现模型在哪些类别上容易出错，以便进行针对性的改进。 **项目结构** 压缩包文件"cnn-master"很可能包含了整个项目的源代码，包括数据预处理、模型定义、训练、评估和结果可视化等相关文件。用户可能需要按照项目文档的指示，逐步运行代码以复现实验结果。总结来说，这个项目展示了如何使用Python和深度学习库（如TensorFlow或Keras）来构建和训练CNN模型，实现手写数字的高精度识别。同时，它也提供了数据可视化和模型评估的方法，对于初学者来说是一个很好的实践平台。

资源推荐

资源详情

资源评论

收起资源包目录

CNN卷积神经网络.zip （21个子文件）

cnn-master

混淆矩阵.png 38KB

数据集下载.png 94KB

data

MNIST

raw

t10k-images-idx3-ubyte.gz 1.57MB

train-images-idx3-ubyte 44.86MB

t10k-images-idx3-ubyte 7.48MB

train-labels-idx1-ubyte.gz 28KB

t10k-labels-idx1-ubyte 10KB

train-images-idx3-ubyte.gz 9.45MB

t10k-labels-idx1-ubyte.gz 4KB

train-labels-idx1-ubyte 59KB

.idea

.name 4B

论文.iml 402B

misc.xml 202B

inspectionProfiles

Project_Default.xml 410B

profiles_settings.xml 174B

modules.xml 264B

.gitignore 47B

CNN_Image_Classification.py 3KB

训练损失.png 25KB

运行结果.png 51KB

测试准确率.png 30KB

import matplotlib.pyplot as plt import seaborn as sns import torch import torch.nn as nn import torch.optim as optim from sklearn.metrics import confusion_matrix from torch.utils.data import DataLoader from torchvision import datasets, transforms # 设置matplotlib支持中文的字体 plt.rcParams['font.sans-serif'] = ['Microsoft YaHei'] # 例如使用微软雅黑 plt.rcParams['axes.unicode_minus'] = False # 解决负号无法显示的问题 # 定义 LeNet 模型 class LeNet(nn.Module): def __init__(self): super(LeNet, self).__init__() self.conv1 = nn.Conv2d(1, 6, 5) self.pool = nn.MaxPool2d(2, 2) self.conv2 = nn.Conv2d(6, 16, 5) self.fc1 = nn.Linear(16 * 5 * 5, 120) self.fc2 = nn.Linear(120, 84) self.fc3 = nn.Linear(84, 10) def forward(self, x): x = self.pool(nn.functional.relu(self.conv1(x))) x = self.pool(nn.functional.relu(self.conv2(x))) x = x.view(-1, 16 * 5 * 5) x = nn.functional.relu(self.fc1(x)) x = nn.functional.relu(self.fc2(x)) x = self.fc3(x) return x # 数据预处理 transform = transforms.Compose([transforms.Resize((32, 32)), transforms.ToTensor()]) # 加载数据集 train_set = datasets.MNIST(root='./data', train=True, download=True, transform=transform) test_set = datasets.MNIST(root='./data', train=False, download=True, transform=transform) train_loader = DataLoader(train_set, batch_size=256, shuffle=True) test_loader = DataLoader(test_set, batch_size=256, shuffle=False) # 实例化模型、损失函数和优化器 model = LeNet() criterion = nn.CrossEntropyLoss() optimizer = optim.Adam(model.parameters(), lr=0.001) # 初始化列表以跟踪每个周期后的损失和准确率 train_losses = [] test_accuracy = [] # 训练模型 for epoch in range(5): # 训练 5 个周期 model.train() running_loss = 0.0 for i, (images, labels) in enumerate(train_loader): optimizer.zero_grad() outputs = model(images) loss = criterion(outputs, labels) loss.backward() optimizer.step() running_loss += loss.item() avg_train_loss = running_loss / len(train_loader) train_losses.append(avg_train_loss) # 测试模型准确率 model.eval() correct = 0 total = 0 all_labels = [] all_predicted = [] with torch.no_grad(): for images, labels in test_loader: outputs = model(images) _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() all_labels.extend(labels.cpu().numpy()) all_predicted.extend(predicted.cpu().numpy()) epoch_accuracy = 100 * correct / total test_accuracy.append(epoch_accuracy) # 输出训练结果 print(f'Epoch [{epoch+1}/5], Loss: {avg_train_loss:.4f}, 准确率: {epoch_accuracy:.2f}%') # 绘制训练损失图 plt.figure(figsize=(10, 5)) plt.plot(train_losses, label='训练损失') plt.title('训练损失') plt.xlabel('周期数') plt.ylabel('损失') plt.legend() plt.show() # 绘制测试准确率图 plt.figure(figsize=(10, 5)) plt.plot(test_accuracy, label='测试准确率') plt.title('测试准确率') plt.xlabel('周期数') plt.ylabel('准确率 (%)') plt.legend() plt.show() # 绘制混淆矩阵 conf_mat = confusion_matrix(all_labels, all_predicted) plt.figure(figsize=(10, 10)) sns.heatmap(conf_mat, annot=True, fmt='d', cmap='Blues') plt.xlabel('预测') plt.ylabel('实际') plt.title('混淆矩阵') plt.show()

评论收藏

内容反馈

版权申诉