基于局部特征和特征聚合的行人重识别研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:zyyhky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代社会下公共安全需求不断增长,监控视频,摄像设备在机场,火车站,地铁,商场等公共场所有着广泛的应用,这些摄像设备主要用来储存和记录监控区域发生的事情,来保证社会的公共安全,因此行人重识别作为计算机视觉的一项关键技术得到了迅速的发展。行人重识别主要解决跨摄像跨场景下行人的识别和检测,在跨摄像头条件下,光照差异,视角差异,物体遮挡,人体姿态差异等因素为行人重识任务带来了巨大的挑战性。随着深度学习技术的不断的发展,现阶段的行人重识别主流模型往往基于卷积神经网络,但是神经网络往往关注于行人整体的特征,导致丢失具有显著区分性的局部信息,因此一些研究工作通过同时对整体和局部信息建模来表征行人。此外,卷积网络不同卷积层的特征有着不同的属性,浅层特征包含更多的细节信息,高层特征包含更多的语义信息,多层次特征聚合研究者们重点关注的方向之一。本文分析了行人重识别的研究进展,并针对如何学习更多的局部特征和聚合卷积不同层次特征展开了研究。本文的主要贡献如下:针对基于局部特征的行人重识别算法会破坏行人图像结构和损失信息的问题,本文提出基于动态记忆指导的信息挖掘算法。具体地,该算法首先提出基于风格的注意力机制,按照行人图像中不同风格的重要性来在通道和空间维度对特征进行调整,以增强深度特征的表征能力。其次为了增加深度特征的多样性和显著性,本文提出了基于动态记忆指导的信息挖掘模块,它可以自适应的在网络中记忆历史信息并消除不同分支间的冗余,使得网络的不同分支关注于行人图像不同的区域。最后受到多视图学习的启发,本文提出了多分支互补网络,通过多分支网络来学习行人图像的多样性特征。在国际公开的数据集上,本算法相较于同期的其他算法有明显的提升。根据卷积网络不同层的视觉特性,本文提出基于层次聚合Transformers的行人重识别算法,Transformers在计算机视觉领域展现出了对序列和长期依赖建模的强大能力。本文同时使用卷积神经网络和Transformers,提出层次聚合Transformers新型学习框架。本文首先提出深监督聚合模块来迭代聚合卷积网络不同层次的特征。其次本文提出基于Transformers的特征校准模块,将该模块插入到卷积网络每一层次之后,该模块将低层特征作为高层特征的全局先验信息。据我们所知,这是第一份同时结合卷积神经网络和Transformers来进行行人重识别的工作。该算法相比较之前的算法捕获到了更加丰富的细节信息,在精度方面也有着显著的提升。
其他文献
无人机由于其高机动性、易部署、价格相对较低和良好的视距(Line of Sight,Lo S)信道等优势引起了广泛关注。对于将物联网场景由2D转化到3D,无人机起到了关键性作用。针对无人机辅助物联网场景,多数学者们研究无人机作为中继使用时,考虑的地面用户为单用户,结合子载波的场景相对较少。在研究无人机作为基站(Base Station,BS)使用时,对无人机能量效率(Energy Efficien
学位
视觉感知一直是人类接触外部世界的主要感知方式,其中图像和视频作为视觉信息的主要载体成为了人类探索外部世界的基础。运用基于深度学习的分割算法对图像和视频中的主要前景对象进行分割,在广泛的实际应用(例如,视频监控、自动驾驶等)中发挥着重要的作用。尽管基于深度学习的全卷积神经网络已经在密集预测任务上取得了阶段性进展,但是依旧存在着诸多潜在的问题。由于图像中复杂的场景(例如,易混淆的对象或前背景低对比度)
学位
区域分割任务旨在对场景中特定的区域进行识别,属于计算机视觉领域中的分支任务,在自动驾驶、地图元素检测及视频理解等方面被广泛应用。相比于传统方法,基于深度学习的区域分割方法准确率更高。但仅利用高阶语义特征进行区域分割的方法受限于目标区域的尺度,常出现分割结果不完整、精度低的情况。针对具体应用场景,利用先验知识对高阶语义特征进行增强和补充成为改善分割结果的重要途径。本文的第一部分针对遥感影像场景下道路
学位
由于获取及存储信息的技术手段飞速发展,观测数据总是表现出高维度大尺寸的特性,大规模数据的分析和处理成为当今信息处理技术的核心和关键。相比于传统的基于矩阵的处理方法,张量(即多维数组)更加适合这种高维度数据的表示和分析,它不仅能够直观描述高阶数据之间的多线性结构,还具有模型精简、可唯一辨识性强等良好特性,因此近年来被广泛用于多维数据的表示和处理中。然而,传统的张量分解算法在处理大规模数据时会面临内存
学位
手部三维模型重建的目标是在给定的图像中恢复整个手部的姿态及表面形状信息。由于该任务可以广泛应用于虚拟/增强现实、机器人抓取、智能家居等众多领域,因此在近年来逐渐成为了计算机视觉领域的研究热点之一。然而,考虑到人手自由度高、自遮挡和自相似严重的问题,许多方案依赖手部三维真值进行全/强监督训练并取得了很好的成果,但也由于三维标注很难获取而限制了方案的实用性。同时,现有的方法更关注网络在某个数据集上的性
学位
自动视频分割任务近年来扮演着越来越重要的角色,该任务不仅被应用于视频会议、自动驾驶等针对特定类别目标的场景,还广泛被应用于包含世界万物的视频场景。然而,由于视频场景复杂且物体在时序上外观变化剧烈,多目标自动视频分割任务在实例分割精度和时间连续性方面仍面临着巨大的挑战。现阶段多目标自动视频分割的研究成果共有的问题包括:相似物体区分困难以及复杂场景物体丢失等等。针对这些问题,本文的研究工作基于时空域的
学位
近年来,深度学习技术蓬勃发展,自动驾驶技术以及其他移动机器人技术也受其影响而取得了巨大的进步。在这些技术领域中,稠密而精确的深度信息,即距离信息,对于多种任务都有着重要的辅助作用。然而,使用To F传感器或激光雷达采集到的深度图均是稀疏的,因此深度补全任务受到了越来越多的关注。本文针对现有的深度补全算法的局限性开展了两方面的研究。Transformer网络结构在自然语言处理领域和计算机视觉领域均取
学位
基于视频的车辆黑烟检测技术对环保工作具有十分重要的意义,在城市环保、智能交通等方面具有广阔的应用前景。现阶段将深度学习技术应用于车辆黑烟检测的研究,大多通过二维卷积神经网络实现对车辆黑烟图像的特征提取,仅依靠黑烟的空间特征使得模型检测能力有限,黑烟检测率低。考虑到实际应用中道路监控视频常常作为黑烟检测的信息流,本文提出了一种新的基于三维卷积神经网络和非局部注意力机制的黑烟车检测网络以充分利用车辆黑
学位
在内能源自动机的动力学计算过程中,通常不考虑驱动与自动机工作循环之间的相互影响关系(即耦合关系),但这会对计算精度造成一定的影响,因此想要提高动力学计算的精度,更好的为内能源自动机的研究设计提供参考,就必须要考虑驱动与工作循环之间的耦合。本文为分析某新型内能源自动机驱动与工作循环动态耦合特性,以某纵动炮闩导气式自动机为研究对象,以该自动机组成及工作原理为基础,建立了工作循环图。采用经典内弹道理论对
学位
为提高轻型高机动车辆的安全性和机动性,需要提高车身防弹性能、降低防护装甲质量,研究轻型复合装甲就至关重要。本文以新型Si3N4增韧陶瓷为研究对象,开展陶瓷复合装甲结构匹配设计及轻量化分析研究。首先对Si3N4陶瓷进行材料动静态压缩实验与飞片平板撞击实验,通过拟合获得Si3N4陶瓷的JH-2本构模型参数;然后对国内外陶瓷装甲的防护标准和测试标准进行总结,并以此为基础对Si3N4陶瓷进行DOP剩余侵深
学位