Deep Person ReID 项目使用指南：从数据准备到模型应用全解析

原创于 2025-06-09 09:04:42 发布

· 352 阅读

版权

Deep Person ReID 项目使用指南：从数据准备到模型应用全解析

deep-person-reid Torchreid: Deep learning person re-identification in PyTorch. 项目地址: https://gitcode.com/gh_mirrors/de/deep-person-reid

前言

Deep Person ReID 是一个基于 PyTorch 的深度学习框架，专注于行人重识别（Person Re-identification）任务。本文将详细介绍该框架的核心功能和使用方法，帮助研究人员和开发者快速上手并应用于实际项目中。

数据准备

数据集配置

在使用该框架前，需要正确准备和配置行人重识别数据集。框架支持多种主流数据集，包括 Market1501、DukeMTMC-reID、CUHK03 和 MSMT17 等。数据集应按照标准格式组织，通常包含训练集（train）、查询集（query）和图库集（gallery）三个部分。

多数据集组合

框架支持同时使用多个数据集进行训练，只需在初始化数据管理器时指定多个数据源：

datamanager = torchreid.data.ImageDataManager(
    root='reid-data',
    sources=['market1501', 'dukemtmcreid', 'cuhk03', 'msmt17'],
    height=256,
    width=128,
    batch_size=32
)

跨数据集评估

框架支持在一个数据集上训练，在另一个数据集上评估的跨数据集测试模式：

datamanager = torchreid.data.ImageDataManager(
    root='reid-data',
    sources='market1501',
    targets='dukemtmcreid',
    height=256,
    width=128,
    batch_size=32
)

模型管理

查看可用模型

框架内置了多种预定义的模型架构，可以通过以下命令查看：

import torchreid
torchreid.models.show_avai_models()

模型复杂度计算

框架提供了计算模型参数数量和计算量（FLOPs）的工具：

from torchreid import models, utils

model = models.build_model(name='resnet50', num_classes=1000)
num_params, flops = utils.compute_model_complexity(model, (1, 3, 256, 128))

注意：此计算仅为理论复杂度估计，实际运行时间还取决于具体实现和硬件。

训练配置

采样器选择

默认使用随机采样器（RandomSampler），但可以更改为其他采样策略，如用于三元组损失的随机身份采样器：

train_sampler='RandomIdentitySampler'

分层学习率

对于微调预训练模型，可以为不同层设置不同的学习率：

optimizer = torchreid.optim.build_optimizer(
    model,
    optim='sgd',
    lr=0.01,
    staged_lr=True,
    new_layers='classifier',
    base_lr_mult=0.1
)

两阶段迁移学习

框架支持两阶段迁移学习策略，先固定基础层训练新层，再联合训练：

engine.run(
    save_dir='log/resnet50',
    max_epoch=60,
    eval_freq=10,
    print_freq=10,
    test_only=False,
    fixbase_epoch=5,
    open_layers='classifier'
)

模型评估与可视化

测试预训练模型

加载预训练权重并测试模型性能：

torchreid.utils.load_pretrained_weights(model, weight_path)
engine.run(test_only=True)

可视化排名结果

可视化查询图像与最相似图库图像的匹配结果：

engine.run(
    test_only=True,
    visrank=True,
    visrank_topk=10
)

红色框表示错误匹配，绿色框表示正确匹配。

可视化激活图

理解模型关注的特征区域：

python tools/visualize_actmap.py \
--root $DATA/reid \
-d market1501 \
-m osnet_x1_0 \
--weights PATH_TO_PRETRAINED_WEIGHTS \
--save-dir log/visactmap_osnet_x1_0_market1501

自定义扩展

添加自定义数据集

创建数据集类，继承ImageDataset或VideoDataset
实现数据加载逻辑，返回(train, query, gallery)三个列表
注册数据集：

torchreid.data.register_image_dataset('new_dataset', NewDataset)

自定义训练引擎

如需实现自定义损失函数，可继承基础Engine类并重写forward_backward方法。参考框架中ImageSoftmaxEngine和ImageTripletEngine的实现。

特征提取API

框架提供了便捷的特征提取接口，可直接用于其他项目：

from torchreid.utils import FeatureExtractor

extractor = FeatureExtractor(
    model_name='osnet_x1_0',
    model_path='a/b/c/model.pth.tar',
    device='cuda'
)

features = extractor(['image1.jpg', 'image2.jpg'])