基于深度学习的行人重识别方法研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:lliiuuffuuyyaann
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
到目前为止,我国已经建成全世界最大的视频监控系统,每天都会产生大量的视频数据,仅仅依靠人工方法对这些数据进行分析的效率会非常低。行人重识别技术是一项可以在跨场景跨摄像头的情形下,在大量的视频序列或图像中寻找到特定行人的技术,已经在公共安全、智慧安防等领域起着重要的作用。但是在现实场景中,由于存在着遮挡、低分辨率以及光照等因素影响,无法提取到具有鲁棒性的行人特征,导致出现行人重识别率低的情况。针对目前行人重识别中存在的提取行人有效特征难的问题,提出了一种基于卷积神经网络的行人重识别方法,主要研究工作如下所述:提出了一种基于多尺度加权特征融合的行人重识别网络模型,首先,在主干网络ResNeSt-50中引入了注意力机制进行行人多尺度特征的提取,可以使网络提高对行人区域的关注度。然后,将提取的多尺度行人特征输入到加权特征金字塔网络进行特征的加权融合,引入加权操作可以让网络模型在训练中自动学习分配给融合特征的权重,从而获得更加丰富的多尺度行人特征。最后,通过多分支网络结构获取富含行人语义信息的全局特征和富含高分辨率信息的局部特征,在训练过程中联合使用Softmax分类损失函数、难样本挖掘三元组损失函数和中心损失函数对模型进行训练。为了验证网络模型的性能,在公开数据集Market-1501、DukeMTMC-reID、CUHK03-Labeled和CUHK03-Detected对模型进行测试,在这4个数据集中mAP精度分别达到了89.4%、80.5%、81.5%和78.4%,Rank-1值分别达到了95.9%、90.7%、82.7%和81.2%。与近几年行人重识别先进算法进行了对比试验,取得了较高的mAP和Rank-1值,证明了网络模型的先进性。进行了多组消融实验,证明了主干网络、注意力机制、加权特征金字塔网络和多分支网络结构的有效性。进行了加权特征金字塔堆叠参数分析实验,证明了当堆叠参数为2时,可以获得最好的实验效果。该论文有图37幅,表9个,参考文献78篇。
其他文献
培养学生统计思维已成为当前国际统计教育讨论的焦点,而教材作为主要的教学资源是培养统计思维的重要载体。采用定量与定性分析结合的方法,基于统计活动视角比较分析人教A版、北师大版、湘教版三版高中新数学教材呈现的统计思维水平和复杂性发现:三版教材都重视“提出统计调查问题”“分析数据”“解释结果”过程,但在“收集或考虑数据”过程提供的学习机会较少;各过程下不同水平的统计思维均有呈现,但水平分布不均衡;都比较
期刊
当前,对“跨学科学习”的关注度越来越高。在实践中,教师应立足学科本位,实施跨界学习,促使跨学科教学能力的提升。其间,需要经历多重环节:进行语文单元内重组和跨单元重组的萌芽阶段,基于“学科+”的组合、整合、融合的发展阶段,跨越虚拟与现实、课堂与生活的高级阶段。
期刊
分类树由机器可解释的语义组成,为许多web应用程序提供了有价值的知识。分类树已被广泛应用于各个领域,特别在电子商务领域中起着至关重要的作用,用于推荐、浏览和查询理解。例如,在线零售商(如亚马逊)使用分类树进行产品推荐,而网络搜索引擎(如百度)利用分类树来增强查询理解。由于手工构建分类树需要付出巨大的人力代价,并且在构建过程中存在较多主观的因素,因此分类树的质量参差不齐。同时,随着web内容量的快速
学位
光流估计是计算机视觉的核心问题之一,在行为识别、视频编辑、自动驾驶等方面都有着广泛的应用。光流表征着三维空间中运动对象在投影面上像素位移的瞬时状态。传统光流估计方法以变分法为基础,但这类方法的准确率与实时性较低。近年来,基于深度学习的光流估计方法凭借实时性高、结果精确等优点,已成为光流研究领域的主要研究热点。目前,现有基于深度学习的方法缺少视频帧间相关度的分析与利用,为此提出一种基于视频帧间相关度
学位
《义务教育语文课程标准(2022年版)》提出了跨学科学习任务群,要求教师引导学生在语文实践活动中,联结课堂内外,使学生获得全面发展。本研究通过设计新型教学实验课,让学生自主进行课题研究,培养其综合运用多学科知识发现、分析、解决问题以及运用语言文字的能力,并通过问卷调查法和访谈法收集学生能力发展情况及自我同一性建立情况,证明学生通过跨学科学习可以有效提高记忆留存度、提高元认知策略发展及学生学习意愿。
期刊
卡通是一种流行的艺术形式,日常生活用于数字娱乐、游戏甚至是在人们的社交账户简介中使用。现代卡通动画工作允许艺术家使用各种来源来创作内容。现实中许多著名的作品是通过将真实世界的照片转化为可用的卡通场景材料而创作的,这一过程被称为图像卡通化。目前基于深度学习的图像卡通风格化方法因计算量过大、执行效率低而无法在实际应用中得到广泛推广。另外卡通图片是将真实世界的照片进行高度简化和抽象,这与其他形式的艺术作
学位
基于深度学习的单图像超分辨率重建方法已经比较完善,重建图像具有较高的客观评价值或具有较好的视觉效果,例如ESRGAN能够还原出符合人眼视觉效果的图像,但是重建过程中虚构出部分高频信息,使得客观评价指标较低。ESPCN重建图像使用亚像素卷积层对高分辨率信息进行恢复,更符合峰值信噪比和结构相似性的评价,具有较高的客观评价指标值,但是高频信息和低频信息的区分度、融合处理不够合理,整体细节较为模糊,视觉感
学位
近年来,随着GPS定位和移动网络技术的不断发展以及智能设备的普及和应用,出现了大量包含位置信息和文本信息的空间-文本对象,使得基于位置的服务(Location Based Service,LBS)得到了广泛应用。带有位置和文本信息的空间-文本数据的规模迅速增长,以空间-文本数据为背景的空间关键字查询技术是基于位置服务系统的重要支撑技术,使得其成为空间数据库和信息检索领域的研究热点。集合空间关键字查
学位
报纸
推荐系统是解决信息过载问题的关键技术,推荐的重点在于预测用户偏好和拓宽用户视野。现有的推荐方法主要利用直接反映用户偏好的显式反馈信息或间接反映用户偏好的隐式反馈信息进行推荐。然而,显式反馈的推荐模型,一般无法考虑用户对打分机制的宽容度差异,在一定程度上会造成数据误差,从而影响推荐结果。因此研究者开始利用隐式反馈信息,但是在使用隐式反馈时,经常忽略那些用户不浏览或不点击的隐式负反馈数据,这类数据信息
学位