Introduction

(1)Motivation:

当前的行人重识别方法都只能在标准的数据集上取得好的效果,但当行人被遮挡或者肢体移动时,往往效果不佳。

(2)Contribution:

① 提出了一个基于区域的适应性质量估计网络(adaptive region-based quality estimation network,RQEN),包含了区域性特征提取模块和基于区域的质量预测模块。其旨在减小低质量图像区域的影响,利用序列中的区域互补。

② 提供了一个大规模的较整洁的数据集:Labeled Pedestrain in the Wild(LPW),包含了2731个行人,从3个不同场景拍摄,每个行人被2-4个相机捕获,共7694个tracklet、590000帧。该数据集囊括了孩童到老人、步行和快跑等不同的场景。

Proposed Method

输入:一个行人的图像序列 S = {I1, I2, ..., In}

区域特征提取模块:landmark detector标记行人身体的关键点 [Wei 2016. Convolutional pose machines.CVPR],middle representation按照关键点位置进行划分,然而由于分辨率低的原因,划分常常不够精确。采用的方法:按照关键点分布,将人体大致分为三个部分,定义 u、m、l 为上部、中部、下部区域,分别生成特征向量,即 ,并进行平均池化。

质量预测模块:对区域特征生成质量估计

最终生成视频特征表示 Fw(S)。

(1)区域生成策略:

令 Pi = {p1, p2, ..., pm} 为图像 Ii 的坐标(landmark)集合,m 为坐标点的数量(作者设置 m = 14),如图:

由于低分辨率和遮挡等影响,很多情况下坐标点很难被确定。

采用 k-means 聚类方法对三个集合进行聚类,聚类的设定为:S1P = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],S2P = [9, 10, 11, 12],S3P = [11, 12, 13, 14].

(2)区域质量预测:

middle representation 输入到卷积网络中,该网络包含卷积层和全连接层,输出的 orignial score μori(Ii) 对应了图片不同的区域,再通过sigmoid函数求出各区域的[0, 1]得分,视频序列不同帧中属于同一区域的得分进行正则化,得到最终结果。

(3)设置聚合单元:

一个图像集合 S = {I1, I2, ..., In},对于每帧图片,有不同的区域表征:,区域对应的质量评估得分为:,则生成的特征为:,其中:

(4)联合训练帧级特征和视频级特征:

训练帧级特征是为了让同一视频内部更紧凑,训练视频级特征是为了让不同视频间更有区分度。

损失函数:

其中三元组损失函数为:

距离采用 L2-norm 距离。

在区域质量估计部分,T表示输入的数据,输出的 orignial score μori(Ii) 为:

再进行正则化:

Experiments

(1)数据集:PRID2011、iLIDS-VID、MARS、LPW

(2)实验结果:

(1)本方法分析:

method(a):GoogLeNet+batch norm(用ImageNet model初始化)[baseline]

method(b)(c)(d):+RU、+RM、+RL表示不同的区域特征

method(e):+QFix表示质量生成单元中设置所有质量得分为1,即消除质量得分的影响

method(f):+MP表示控制参数数量不变(作者提到在RQEN方法中参数会变多?这是为什么?)

(2)对比方法分析:

最新文章

  1. js 字符串转换成数字的三种方法
  2. xcode 中 的工程模板
  3. C#窗体 WinForm 对话框,流
  4. 排序算法 2 qsort 库函数,泛型函数
  5. javascript中的call()和apply()方法的使用
  6. Hao123这个流氓
  7. 深入理解移动web开发之PPI,Pixel,DevicePixelRatio(转)
  8. (转)Spring读书笔记-----Spring核心机制:依赖注入
  9. make 2>&1 | tee log.txt之小析
  10. IT服务(运维)管理实施的几个要点--序言
  11. python 模块:xlrd && xlwt
  12. AspNet Core Web 应用程序的启动(有关 Program.cs类/ Startup.cs类 ) 当项目中干掉 Startup.cs 类如何设置启动 配置等等
  13. 【Android Studio安装部署系列】八、Android Studio主题皮肤更换
  14. 使用@Validated分组遇到的坑
  15. 【转】RO段、RW段和ZI段 --Image$$??$$Limit 含义(zz)
  16. LOJ2540 [PKUWC2018] 随机算法 【状压DP】
  17. Android 音视频深入 三 MP4解码播放视频 (附源码下载)
  18. 使用渐进式JPEG来提升用户体验
  19. Prim算法和Kruskal算法
  20. jmeter运行时间越久发送请求越来越少

热门文章

  1. (数据科学学习手札75)基于geopandas的空间数据分析——坐标参考系篇
  2. WTL Picture Control显示图片
  3. used in key specification without a key length
  4. Spring Cloud第十三篇 | Spring Boot Admin服务监控
  5. 【限时免费】近1000G JAVA学习视频下载
  6. Mutual Information
  7. Java 代码实现链表
  8. 第3章 JDK并发包(五)
  9. throw throws区别
  10. 2020-02-19Linux学习日记,第一天