基于视频的行人重识别方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:q18198837
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别最近几年在学术和工业界得到广泛的关注,该方向主要包含基于图片和基于视频的行人重识别两个方向。其主要解决的问题是多个摄像头的场景下行人是否为同一个人。该方向的研究对于在商场中寻找丢失的孩童,或者公安用于侦察罪犯等公共安全问题尤为重要。但是因为光照、遮挡、模糊、行人姿态以及相机视角等因素的影响,使得同一个行人在不同的摄像头下存在着很大的变化。本文主要从视频角度来解决该问题。基于视频的行人重识别每个人在摄像头下都是一个序列,采用视频序列可以获取到更加丰富的时空信息。首先,本文从特征表达方向考虑。特征表达是通过学习判别性的特征来区分不同的行人。不同于静态图片只有空间信息,视频序列还具有时序信息。本文利用姿态估计的方法获取行人的关节点,通过脚踝的关节点,可以重新合成行人的高质量行走周期。同时为了获取空间信息,利用姿态关节点将行人划分为各个局部区域,提取局部特征,最后将行走周期的多张图片特征拼接为最终的时空特征。最终的实验结果证明提出的时空特征能够在视频序列上取得很好的效果。其次,本文从度量学习角度考虑。度量学习是学习判别性的度量矩阵来区分不同的行人。针对之前提取到的时空特征,考虑到不同的姿态具有不同的时序信息,在度量学习过程中加入姿态约束。根据提取的特征,对应的姿态应该是一样的,在相似性计算中只计算对应姿态的距离,最后将行走周期中多个姿态的距离相加,作为最后的相似性。同时为了佐证算法思想的合理性,本文利用动态时间规整算法来计算两个序列的距离,得到两个序列的规整路径。最后的实验结果证明该方法是目前非深度学习方法中效果最好的。最后,本文也在深度学习方法上探索基于视频的行人重识别问题。在视频行人重识别领域采用时序模型提取时序信息和利用注意力机制预测图片质量是两种常用方法。因此本文结合这两种方法提出基于时序注意力机制的深度网络。首先给出一个时序模块,利用先前帧信息来提高当前帧的特征表达,接着设计一种注意力机制模型来为序列中各帧质量打分,最后通过加权融合得到各个序列的最终特征。最后的实验结果证明提出来的时序注意力模型能够在视频行人重识别中取得优异的表现。本文主要是针对基于视频的行人重识别开展研究,通过利用视频更加丰富的信息,来提高行人重识别的精确度,该研究的成果对于公共安全具有重要的意义。
其他文献
通江县位于四川盆地东北部,通江方言属于西南官话成渝片。本文通过对通江方言的调查材料,主要描写了通江方言的20个声母、37个韵母和4个声调,分析了其声韵调的特征。不仅能给
社会新闻是都市类报纸的主要内容之一,它与时政新闻、经济新闻、国际国内新闻、文化体育新闻等共同构成了都市类报纸丰富的新闻内容,深受广大受众的关注和喜爱。
分析了造成某电厂410t/h锅炉磨煤机电机扫膛的原因,说明了电机扫膛的危害;从设备检修和生产运行管理两方面提出处理和事故防范措施。在设备检修上,通过改变镶套材料材质、规
本文研究了两种新型的基于热平板上莱登弗罗斯特效应的自推进器件。具有莱登弗罗斯特效应的液体被我们应用于制备一种能够稳定维持该种效应的器件,就目前来讲,这是首次将一个
目的:探究在直肠癌合并糖尿病患者围术期护理中应用加速康复外科的效果,分析其对患者睡眠的影响。方法:选取2017年1月至2018年12月福建医科大学附属第一医院收治的直肠癌根治
针对磁致伸缩导波无法确定管道缺陷周向位置的弊端,研究了一种利用阵列式磁致伸缩导波传感器对管道裂纹进行周向定位的方法。分析了非轴对称声源所激发导波的振动模态,计算了在
在弱监督条件下的图像和视频协同分割与定位旨在利用少量监督信息挖掘图像与视频中存在的共同对象的问题。协同分割与定位方法可以降低对于类标信息的依赖,减轻人工标注的负
在《老子》中,道路只有两条:道与盗。无心或有意偏离道者,必将归于盗。道超越了仁义智勇等人道价值,在其主导之下,仁义智勇都获得新的规定。修道者以爱而不用、守身勿失的一
本文运用文献计量可视化软件CiteSpace绘制了美国理论社会学领域期刊《社会学理论》《理论与社会》1998-2016年刊载文献共被引图谱,探测出近20年来美国社会学理论热点问题与
弱势群体作为当今社会一个非常特殊而广泛的群体,某种程度上言,在其衡量一个国家是否切实保障和实现人权方面常被作为标杆出现。保障社会弱势群体的衣、食、住、行既是人权保