武汉大学等发布ReID最新综述!囊括三大视觉顶会,提出新基准方法AGW|TPAMI2021
新智元推荐
新智元推荐
来源:知乎
作者:叶茫
【新智元导读】本文全面调研了近年来深度学习在Re-ID领域的进展,囊括了近几年三大视觉顶会上的大部分文章,包括Closed-world Re-ID与Open-world Re-ID的研究进展。并提出新评价指标mINP以及一个强有力的AGW方法。
行人重识别(Person Re-Identification,简称Re-ID),是一种利用计算机视觉技术来检索图像或者视频序列中是否存在特定行人的AI技术,在智慧城市等监控场景中具有重要的应用意义和前景。
本文介绍我们最新的IEEE TPAMI综述论文 《Deep Learning for Person Re-identification: A Survey and Outlook》,该文作者来自武汉大学、起源人工智能研究院(IIAI)、北理工、英国萨里大学、Salesforce亚洲研究院。
知乎原文:
https://zhuanlan.zhihu.com/p/342249413
这里先总结该综述的几个主要贡献点:
1、综述:全面调研了近年来深度学习在Re-ID领域的进展,囊括了近几年三大视觉顶会上的大部分文章(如有遗漏,请谅解)。主要包括Closed-world Re-ID与Open-world Re-ID的研究进展,常用数据集和评价指标的概述,并分析了现有方法的不足和改进点。
2、展望:
1) 一个新的评价指标mINP,用来评价找到最困难匹配行人所需要的代价;
2) 一个强有力的AGW方法,在四种不同类型的Re-ID任务,包括12个数据集中取得了较好的效果;
3) 从五个不同的方面讨论了未来Re-ID研究的重点和难点,仅供大家参考。
前言
图 1. 构建行人重识别系统的五个主要步骤。包括:1)数据采集,2)行人框生成,3)训练数据标注;4)重识别模型训练,5)行人检索
Closed-world Re-ID
图 2. 四种主要的Re-ID特征学习方法
全局特征学习,利用全身的全局图像来进行特征学习,常见的改进思路有Attention机制,多尺度融合等; 局部特征学习,利用局部图像区域(行人部件或者简单的垂直区域划分)来进行特征学习,并聚合生成最后的行人特征表示; 辅助特征学习,利用一些辅助信息来增强特征学习的效果,如语义信息(比如行人属性等)、视角信息(行人在图像中呈现的不同方位信息)、域信息(比如每一个摄像头下的数据表示一类域)、GAN生成的信息(比如生成行人图像)、数据增强等; 视频特征学习:利用一些视频数据提提取时序特征,并且融合多帧图像信息来构建行人特征表达 特定的网络设计:利用Re-ID任务的特性,设计一些细粒度,多尺度等相关的网络结构,使其更适用于Re-ID的场景。
2.2 度量学习方法
图 3. 三种常见的Re-ID度量学习(损失函数)方式
Identity Loss: 将Re-ID的训练过程当成图像分类问题,同一个行人的不同图片当成一个类别,常见的有Softmax交叉熵损失函数; Verification Loss:将Re-ID的训练当成图像匹配问题,是否属于同一个行人来进行二分类学习,常见的有对比损失函数,二分类损失函数; Triplet Loss:将Re-ID的训练当成图像检索问题,同一个行人图片的特征距离要小于不同行人的特征距离,以及其各种改进; 训练策略的改进:自适应的采样方式(样本不均衡,难易程度)以及不同的权重分配策略
用学习好的Re-ID特征得到初始的检索排序结果后,利用图片之间的相似性关系来进行初始的检索结果优化,主要包括重排序(re-ranking)和排序融合(rank fusion)等。
图 4. 重排序示例
2.4 数据集和评价
Open-World Re-ID
3.1 多模态(异构)数据
基于深度图像Re-ID:旨在利用深度图信息的匹配(融合或跨模态匹配),在很多人机交互的室内场景应用中非常重要; 文本到图像Re-ID;旨在利用文字语言描述来搜索特定的行人图像,解决实际场景中查询行人图像缺失等问题; 可见光到红外Re-ID:旨在跨模态匹配白天的可见光图像到夜晚的红外行人图像,也有一些方法直接解决低照度的重识别任务; 跨分辨率Re-ID;不同高低分辨率行人图像匹配,旨在解决不同距离摄像头下行人分辨率差异巨大等问题
3.2 端到端Re-ID(End-to-end Person Search)
纯图像/视频的Re-ID;从原始raw 图像或者视频中直接检索出行人; 多摄像头跟踪的Re-ID;跨摄像头跟踪,也是很多产业化应用的重点。
3.3 半监督和无监督的Re-ID
无监督Re-ID:主要包括一些跨摄像头标签估计(聚类或图匹配等)的方法,以及一些其他监督信息挖掘的方法(如local patch相似性等); 无监督域自适应Re-ID:包括一些目标域图像数据生成和一些目标域监督信息挖掘等方式。
表 1. 现有无监督学习方法在常见数据集上的效果
3.4 噪声鲁棒的Re-ID
Partial Re-ID:解决行人图像区域部分被遮挡的行人重识别问题; Noise Sample:主要针对行人图像或视频中检测、跟踪产生的错误或偏差 Noise Label:主要针对行人标签标注产生的错误
3.5 Open-set Re-ID and Beyond
展望
4.1 新的评价指标mINP
4.2 新的基准方法AGW
图 5. AGW 方法的示意图
4.3 对未来一些研究方向的思考
不可控的数据采集:不确定多种模态混合的Re-ID,而不是固定的模态设置;换装的Re-ID,2020年已经有好几个新的数据集; 减少人工标注依赖:人机交互的主动学习,选择性的标注;从虚拟数据进行学习(Learning from virtual data),如何解决虚拟数据中的domain gap; 面向Re-ID通用网络设计:Domain Generalized Re-ID,如何设计一种在未知场景中也表现优异的模型,如何利用自动化机器学习来设计针对Re-ID任务的网络模型; 动态的模型更新:如何以小的代价将学习好的网络模型微调至新摄像头场景中;如何高效的利用新采集的数据(Newly Arriving Data)来更新之前已训练好的模型; 高效的模型部署:轻量型快速的行人重识别算法设计,自适应的针对不同类型的硬件配置(小型的移动手机和大型服务器)调整模型。
推荐阅读:
15岁上浙大、22岁获世界冠军,90后「天才黑客」为何被开除、错失上亿股票?
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 一老一小系民心 一枝一叶总关情 7992522
- 2 大S去世 7908435
- 3 大S流感并发肺炎 7818333
- 4 大年初六遇立春 7741147
- 5 汪小菲换黑色头像 7614028
- 6 小S悲痛悼念:感恩成为姐妹 7510044
- 7 影院回应一天排99场哪吒2 7425394
- 8 正月初六送穷日 7316462
- 9 小S关闭评论区 7219600
- 10 “以旧换新”激发消费新活力 7160966