file-type

UPAR:行人属性识别与人物检索的统一数据集与基准模型

PDF文件

642KB | 更新于2025-01-16 | 171 浏览量 | 0 下载量 举报 收藏
download 立即下载
"UPAR:统一行人属性识别和人物检索数据集和基线模型" UPAR,全称为Unified Pedestrian Attribute Recognition,是由Andreas Specker等人提出的,旨在解决行人属性识别和人物检索问题的数据集和基线模型。这个数据集整合了四个知名的人物识别数据集——PA100K、PETA、RAPv2和Market1501,通过添加330万个额外的注释,统一了40个关键的二进制属性类别,涵盖12个属性领域。这一举措旨在促进研究者对行人属性识别和基于属性的人物检索在不同环境和条件下的泛化能力的理解。 在行人属性识别中,识别个体的软生物特征,如年龄、性别、穿着等,对于视频监控和时尚检索等领域至关重要。然而,现有的数据集存在显著的偏差和变化,如属性分布、视角、光照条件和图像分辨率,这限制了方法在实际应用中的表现。UPAR的创建为研究者提供了一个更全面、更具挑战性的平台,用于评估和改进算法的泛化能力。 由于图像间的分布差异、行人姿态、比例和遮挡等因素,当前的方法在准确性和处理速度上面临挑战。为此,研究人员还开发了一种强大的基线模型,通过深入分析正则化方法,优化了PAR和基于属性的人物检索性能。这个基线模型在PA100k、PETA、RAPv2、Market1501-Attributes和UPAR的跨域及专业化设置中实现了最先进的结果。 行人属性识别在智能视频监控中扮演着关键角色,帮助系统理解和追踪目标。在在线零售中,它允许用户通过属性筛选来精确搜索商品,无需提供查询图像。例如,用户可以查找特定颜色、风格或品牌的服装,而无需上传图片。随着深度学习技术的发展,视觉模型在处理这类任务上取得了显著进步,但仍然需要更大的、多样化的数据集来推动进一步的创新。 UPAR数据集的发布为人工智能社区提供了宝贵的资源,有助于推动大规模、可推广的属性识别系统的研究。数据集可通过链接<https://github.com/speckean/upar_data>获取。通过UPAR和提供的基线模型,研究者可以更好地评估和训练他们的算法,以应对现实世界中行人属性识别和人物检索的复杂性。

相关推荐

cpongm
  • 粉丝: 6
上传资源 快速赚钱