基于深度学习的行人重识别算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:w_wangjing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别是利用计算机视觉技术从跨域视角候选图像数据集或者非重叠监控视频序列中检索出与指定行人具有相同身份信息行人的过程。行人重识别技术在行人轨迹跟踪以及智能安防领域发挥着重要的作用。受到拍摄设备以及环境中各种干扰因素的影响,使得行人重识别任务在实际应用中面临诸多挑战。因此,提取更具有鲁棒性和高区分度的行人特征成为了行人重识别研究领域的重点课题之一。针对这些问题,本文从两个不同角度提出了优化行人重识别性能的方法,具体工作为:(1)针对局部特征间度量时容易出现人体对应部位对不齐而导致的特征匹配存在偏差的问题,本文借助人体语义分割算法精确的人体部位识别能力,提出了一种能够有效解决局部特征对不齐的方法。该方法通过卷积神经网络模块构建了全局和局部特征提取两个网络分支结构。其中全局特征提取子网络用于提取行人图像的全局视觉特征,而在局部特征提取子网络中,首先将全局视觉特征输入到通道注意力机制模块中以消除无效特征通道对结果的影响,其次将人体语义分割概率图与经过通道注意力机制得到的特征进行计算,得到精确定位的人体各个身体部位特征图。通过局部特征子网络不仅可以精准提取到具有丰富细节以及高区分度的局部特征,而且由于人体语义分割概率图与行人特征图之间仅仅是覆盖叠加关系,因此能够有效避免局部特征对应部位对不齐问题。最后通过动态加权模块为每个局部特征自适应地分配不同权重以使网络更加关注高区分度的局部特征,进一步提升网络的表征能力。(2)上述通过卷积神经网络模块构建网络结构的方法难以捕获相距较远的图像区域之间的长程依赖关系,并且网络中的池化及卷积等下采样操作会导致特征分辨率降低。针对卷积神经网络存在的局限性,本文提出了基于Vi T(Vision Transformer)模型的行人重识别方法。由于Transformer模型结构中多头自注意力机制能够关注到全局上下文信息并且模型结构本身不需要任何下采样操作,所以该网络结构天然地解决了卷积神经网络模型中存在的问题。此外,为了使Vi T模型更加适应行人重识别任务,本文创新性地设计了最短距离矩阵模块和视点信息嵌入模块。其中最短距离矩阵模块是为了让Transformer结构提取有效的行人局部特征,而视点信息嵌入模块则是为了降低不同视点(不同相机或者不同视角)引起的识别偏差。最后,本文将基于Vi T模型的全局特征和局部特征提取部分结合在一起共同训练,有效地提升了网络模型性能。(3)本文所提出的两种方法均与目前主流的行人重识别方法在Market-1501和Duke MTMC-re ID两个数据集上进行了实验对比,验证了本文所设计的两个网络结构的有效性,并取得了较好的结果。另外,由于第二种方法是为了解决第一种方法在卷积神经网络上存在的问题而提出的,因此其综合性能均优于第一种方法。
其他文献
随着社会数字化的推进,传统金融行业与互联网技术的融合不断加深,新兴互联网金融为金融行业发展注入新的活力。命名实体识别技术可以从海量的金融信息中挖掘出有效的信息,在促进智慧金融发展、提升金融服务质量、满足多元化投融资需求等方面发挥积极作用。然而,现阶段的命名实体识别模型针对中文互联网金融领域的研究较为匮乏,不能有效识别出金融实体,进而影响金融行业获取信息的效率。本文结合中文互联网金融领域文本语言结构
学位
OpenCL凭借其开放性和代码可移植性成为异构并行计算中热门的并行编程框架。OpenCL程序不具备良好的性能可移植性,当OpenCL程序跨平台移植时需要重新对其进行参数优化,该过程耗时耗力,故OpenCL程序的参数自动优化一直是研究重点。在OpenCL程序参数自动优化中,存在调优参数选择不合适而无法有效发挥设备性能的情况。在搜索空间的选择上通常会选择较大的搜索空间以保证对多种设备的兼容性,该方式会
学位
近年来,数字出版已经形成了较为完整的产业链,供给方通过将物品的使用权让渡给使用方,并以此获取一定回报。然而,由于这些多媒体数据多是由数字图像、视频、音频和文本组成的,在网络传播的过程中极易泄漏和篡改。作为保护作品版权的主要方式,数字鲁棒水印技术在保护数字版权领域中有着举足轻重的地位。现行水印方案的时间性能受限于运行设备的计算能力,运行空间以及图片规模等因素难以发挥出全部的性能,限制了水印技术的广泛
学位
随着中国数字产业的持续发展,网络化软件已然成为当下软件工业化的主流应用。而当下庞大的软件规模和软件单元之间的复杂异构关系使得软件在运行期间所涉及到的资源可能会随时发生变化,一旦软件在运行过程中出现无法承受巨大的压力出现宕机情况,企业乃至于社会层面付出的代价将是无法估量的。因此如何让网络化软件在运行过程中自行分析软件状态或环境状态变化,实现软件在线自优化,成为目前软件工程领域的巨大挑战和热门研究课题
学位
随着互联网和人工智能技术的快速普及与发展,数据信息的收集与共享日渐频繁,各大机构根据已发布的数据通过数据挖掘技术发现用户的潜在行为和需求,推动精准服务领域的发展,而由此带来的数据安全问题也愈发严重。一方面,公开的数据中包含敏感信息,考虑到敏感信息内隐含了用户的身份信息,财产流水等隐私,因此数据发布者须对真实数据进行隐私保护后再发布。另一方面,数据发布的目的是使用数据并产生相关的价值,隐私保护后的发
学位
在自动驾驶领域,对路面上小障碍物检测,能够帮助汽车躲避障碍保证驾驶安全。随着具有辅助驾驶功能的新能源汽车的推广和普及,小障碍物的检测定位越来越具有意义。然而小目标在图像中占有的像素少、边缘信息模糊,使得关于小目标检测的研究充满挑战。本文创建了路面小目标障碍联合数据集,数据集中驾驶场景丰富、目标种类多样、小目标占比超过90%。目标检测算法在小目标联合数据集上的性能作为衡量算法对小目标检测性能的标准。
学位
随着互联网的发展,各种应用的业务逻辑变得更加复杂,涉及到的数据急剧增加,对数据库性能的要求也越来越高。在当前国际形势下,为避免核心技术受制于人,数据库系统软件国产化已是必然趋势,Gauss DB采用大规模并行处理架构,同时支持行存储与列存储,并提供PB级别数据量的处理能力。openGauss作为Gauss DB的开源版本于2020年7月发布,集成了机器学习结合数据库调优的技术,其中智能索引推荐技术
学位
20世纪以来,空调机组的使用率大大提升。而其中的工厂级空调机组由于重要性之高与故障损失之大总是让管理人员为运维而发愁。为了更好的节省成本与保障安全,设备的故障分析与健康管理方式早就引起人们的关注。而相关的技术研究中,设备运维显然是最重要的课题。研究表明,当前大部分的设备运维依旧采用着“先损后修”的方式,这样的维修方式存在着安全性不高、耗费代价过大等恶劣影响。而新一代的运维思路,即“定时维修”。虽然
学位
三目标水库调度是一个复杂的多目标优化问题,其复杂性主要体现在决策空间和目标空间两个方面。决策空间层面的复杂性主要体现在决策变量的序列维度高,并且各个决策维度之间存在链式相关性;目标空间层面的复杂性主要体现在各个目标求解过程中存在难度差异,使得最优化解集分布不均,导致帕累托前沿面的形状复杂。决策空间和目标空间的求解复杂性,致使三目标水库调度问题的求解不够高效。因此,本文围绕如何高效求解三目标水库调度
学位
科技服务业是在创新驱动与产业融合的趋势下形成的一种新兴服务产业,是助推科技成果转化与经济发展方式转变的重要手段。科技文献服务与专家咨询服务是科技服务应用的重要分支,能够满足相关技术人员及企业对科技文献检索、科研成果发现、专家技术咨询及交流与合作等需求,为其提供专业的技术支持。科技信息数据存在专业性高、针对性强、学科间交叉广泛等特点,且具有较高的时效性要求,因此,科技服务推荐面临着文本数据稀疏、特征
学位