深度学习Caffe：MNIST数据集转换详解

PDF文件

84KB | 更新于2024-08-30 | 35 浏览量 | 举报收藏

立即下载

"深度学习caffe–手写字体识别例程（五）—— convert_mnist_data.cpp文件详解" 在深度学习框架Caffe中，`convert_mnist_data.cpp`是用于处理MNIST手写数字数据集的关键工具，它将原始的二进制文件转换为适合训练神经网络的数据库格式，如LMDB或LevelDB。这一过程对于有效加载和预处理数据至关重要，因为这些数据库格式能够高效地存储和检索大量样本，是Caffe训练模型时常用的数据输入方式。在上文提到的命令中，`convert_mnist_data.bin`接收三个参数：训练图像文件、训练标签文件以及目标数据库的路径，并通过`--backend`参数指定要使用的数据库类型。在源代码中，这个命令是由`convert_mnist_data.cpp`中的功能实现的。文件开头的`#include`指令引入了必要的库，如`iostream`用于输入输出，`fstream`处理文件流，`google/protobuf/io/coded_stream.h`处理协议缓冲区的编码流，`caffe.proto`包含了Caffe的协议缓冲区定义，`caffe/util/db.h`和`caffe/util/format.h`则是Caffe数据库操作和数据格式转换的接口。 `#ifdef defined(USE_LEVELDB) && defined(USE_LMDB)`是一个条件编译指令，确保在Caffe编译时启用了LevelDB和LMDB支持。这是因为这两个数据库系统分别有各自的库文件，需要在编译时链接。如果未启用，程序不会执行数据库转换部分的代码，这通常意味着Caffe只被配置为支持一种数据库系统。 `convert_mnist_data.cpp`的主要工作流程包括： 1. 读取MNIST数据集的二进制文件，这些文件通常包含两部分：图像数据和对应的标签数据。 2. 解析图像数据和标签数据，将其转换为Caffe的Blobs，这是Caffe中用于存储多维数组的数据结构。 3. 使用Caffe的`db::DB`接口创建新的数据库连接，可以是LMDB或LevelDB。 4. 将Blobs中的数据逐条写入数据库，每个样本作为一个键值对，键通常是样本的索引，值是样本的数据和标签。 5. 最后，关闭数据库连接，转换完成。整个过程中，`convert_mnist_data.cpp`通过`caffe::Datum`类来封装每个MNIST样本，它包含了图像数据和对应的标签。然后，借助`caffe::db:: transaction`对象，将`Datum`序列化并写入数据库。这个过程实现了将原始MNIST数据集转化为Caffe可直接读取的格式，为后续的深度学习模型训练提供了便利。 `convert_mnist_data.cpp`是Caffe中用于数据预处理的重要工具，它将MNIST数据集转换为高效、易于读取的数据库格式，使得深度学习模型能够快速、有效地进行训练。理解这一工具的工作原理有助于更好地掌握Caffe的训练流程，以及如何自定义数据预处理步骤。

深度学习深度学习caffe–手写字体识别例程（五）手写字体识别例程（五）——

convert_mnist_data.cpp文件详解文件详解

我们在《深度学习caffe–手写字体识别例程（四）》中，用到了convert_mnist_data.bin文件进行数据集格式的转换，命

令如下

$BUILD/convert_mnist_data.bin $DATA/train-images-idx3-ubyte \

$DATA/train-labels-idx1-ubyte $EXAMPLE/mnist_train_${BACKEND} --backend=${BACKEND}

它的作用是将mnist数据集转换为lmdb或leveldb格式的文件，以便用于深度学习的训练。这篇文章我们就来研究

convert_mnist_data.bin这个文件是如何实现的。convert_mnist_data.bin文件的源文件在example/mnist/目录下，文件名为

convert_mnist_data.cpp，由于这个文件中的代码比较长，我们下面把代码贴出来，并在每行或几行的代码下面进行解释。

#include

#if defined(USE_LEVELDB) && defined(USE_LMDB)

#include

#endif

#include

#include // NOLINT(readability/streams)

#include

#include "boost/scoped_ptr.hpp"

#include "caffe/proto/caffe.pb.h"

#include "caffe/util/db.hpp"

#include "caffe/util/format.hpp"

这些代码是文件包含的头文件，是文件中需要使用到的头文件。

#if defined(USE_LEVELDB) && defined(USE_LMDB)

这是一个判断的宏，如果满足判断条件，则编译下方的代码，否则编译#else下面的代码。我们总览这个文件，发现#else

在文件的结尾处，只包含了几行代码。这个宏的根本作用在于，判断是否定义了USE_LEVELDB和USE_LMDB，如果定义了

则进行文件格式转换的操作，否则，不操作。这两个宏是在编译caffe源码的时候定义的。

using namespace caffe; // NOLINT(build/namespaces)

using boost::scoped_ptr;

using std::string;

这3行是这个文件需要用到的库。

DEFINE_string(backend, "lmdb", "The backend for storing the result");

这行代码在这个文件中没能找到DEFINE_string的定义。其实它是在gflags.h文件中定义的，这个文件

在/usr/include/gflags/目录下，有兴趣可以打开文件研究一下，DEFINE_string是一个宏定义，这里我们只介绍一下它的作用。

调用DEFINE_string之后，会生成基于backend生成一个变量FLAGS_backend，并且变量的取值为“lmdb”，"The backend for

storing the result"是这个变量的说明。

uint32_t swap_endian(uint32_t val) {

val = ((val <> 8) & 0xFF00FF);

return (val <> 16);

}

这段代码是一个函数，它的作用是对32位的整形变量进行大小端转换，在《深度学习caffe--手写字体识别例程（三）》

中，我们介绍了，在mnist数据集中，多字节的数据是按照大端模式存储的，也就是数据的高字节存在低地址，如果我们进行

数据读取数据读出来之后，字节顺序是反的。比如一个32字节的数据0x12345678，它在mnist文件中存储时，相对地址0地址

为12，1地址为34，2地址为56，3地址为78。当从文件中读取32位的数据时，读出来的是0x78563412，与原始数据正好是反

的。所以需要用这个函数进行转换。

下载后可阅读完整内容，剩余4页未读，继续阅读

开通会员，免费下载（低至0.43元/天)

成为会员后, 你将解锁

下载资源随意下

优质VIP博文免费学

优质文库回答免费看

付费资源9折优惠

weixin_38611812

粉丝: 4

深度学习Caffe：MNIST数据集转换详解

convert_mnist_data.cpp

cpp_torch:它是基于libtorch的tiny-dnn。 只有libtorch，深度学习框架以外的没有标题的标头

深度学习caffe–手写字体识别例程（二）—— get_mnist.sh脚本文件详解

深度学习caffe–手写字体识别例程（八）—— 求解器描述文件lenet_solver.prototxt详解

mnist_test_leveldb.zip_MNIST_MNIST 数据集_MNIST数据集_caffe_mnist测试数据集

lenet_iter_10000.zip_caffe_caffe mnist_caffe 识别_lenet mnist_mnis

get_mnist.sh1 get_mnist.sh2 create_mnist-lmdb train_lenet

convert_weights_to_caffemodel.zip_caffemodel_darkent 2 caffe_dar

visulize.zip_MNIST 可视化_caffe_mnist特征权重可视化_visulize_可视化 MNIST

res10_300x300_ssd_iter_140000_fp16.caffemodel、opencv_face_detector_uint8.pb

最新资源

cpp_torch:它是基于libtorch的tiny-dnn。只有libtorch，深度学习框架以外的没有标题的标头