基于提升卷积神经网络的高精度行人重识别算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:aqwww8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着国家科技与经济发展,监控摄像头在医院、学校、机场等公共场所广泛部署。然而,监控摄像头数量的快速增长也带来了海量的监控数据,给传统的人工处理带来极大挑战,因此,能够自动识别并追踪特定行人的智能安防系统成为了国内外的研究热点。行人重识别技术是智能安防系统的重要组成部分,它是利用计算机视觉算法判断监控图像或监控视频中是否存在特定行人的技术。由于其巨大的研究与实用价值,吸引了学术界与工业界大量的关注,是目前计算机视觉领域重要的研究课题之一。然而,在行人重识别模型的现实应用部署中,仍然会受到跨场景、跨域和跨分辨率这三个复杂因素的影响,导致识别精度低。本文围绕这三个问题进行了深入和系统的研究,旨在提高基于深度学习的行人重识别精度。主要研究内容和创新点包括:1.基于背景和网络改进的跨场景行人重识别算法。跨场景(摄像头)行人重识别通常面临着内部挑战和外部挑战。内部挑战是在跨摄像头的现实场景中行人的背景不停变化,这些背景噪声对模型的训练和应用造成严重影响。针对这一问题,本文提出了背景逐渐抑制策略,将行人图像用目标检测算法和语义分割算法提取行人前景和背景,给背景分配不同的权重,再输入进不同的卷积神经网络分支训练。外部挑战是在现实场景部署模型时,模型的特征辨识力不足。针对这一问题,本文提出了特征金字塔优化策略,在不增加网络参数的前提下解决传统特征金字塔误差回传的问题。经过实验验证,本文提出的背景逐渐抑制策略和特征金字塔优化策略,在Market-1501,CUHK03-detected和CUHK03-labeled这三个数据库上相比于目前最好的方法分别在rank-1指标上提升了1.03%,1.41%和3.14%的准确率,能够有效提高跨摄像头场景中的行人重识别精度。2.基于风格转换的跨域无监督行人重识别算法。针对现实应用场景中大规模行人数据无法标注的问题,本方法使用了循环生成网络将已标注数据库和未标注数据库进行风格转换,使用被转换风格后的已标注数据库训练模型,从而将跨域无监督行人重识别问题转化为有监督问题。由于风格转换的过程是无监督进行,会造成同一行人的图像会与不同行人的图像互相转换的现象,导致行人身份特征被破坏。针对这一问题,本文在循环生成网络中加入了自监督三元组网络对行人身份信息进行保护。同时,本方法引入了最大均值差异损失,在训练过程中,模型将拉近未标注数据库和已标注数据库的分布。经过实验验证,本文提出的自监督三元组网络和最大均值差异损失,在Duke MTMC-re ID和Market-1501这两个数据库上相比于目前最好的方法分别在rank-1/m AP指标上提升了1.35%/2.05%,1.83%/1.74%的准确率,能够有效提高跨域无监督场景中的行人重识别精度。3.基于分布统一的跨分辨率行人重识别算法。受光线、距离和摄像头像素等复杂因素影响,现实应用场景中获取的行人图像分辨率通常具有很大差异。传统的解决跨分辨率行人重识别问题的方法通常使用超分辨模块提升图像的分辨率,再使用行人重识别模块训练已被超分的图像得到模型。但是此类方法都忽视了在跨分辨率行人重识别任务中广泛存在的分布差异问题。针对这一问题,本文在超分辨模块和行人重识别模块分别加入了超分辨分布损失和行人重识别分布损失,在超分辨模块中,将生成的超分辨图像与高清图像计算最大均值差异损失,从图像层级拉近超分辨图像和高清图像的分布距离。在行人重识别模块中,使用两个卷积神经网络分支分别训练高清图像和超分辨图像,计算两个分支所得特征的最大均值差异,在特征层面拉近分布距离。经过实验验证,本文提出的超分辨分布损失和行人重识别分布损失,在VR-Market1501,VR-MSMT17Hard和CAVIAR数据库上相比于目前最好的方法在rank-1/m AP指标上提升了4%/5.3%,4.1%/5.2%和3.2%/4%的准确率,能够有效提升跨分辨率场景中的行人重识别精度。
其他文献
随着计算机技术的不断进步,基于深度学习的人工智能技术高速发展,已经被广泛应用在交通场景下。尤其在智能交通系统和自动驾驶场景中,通过使用目标检测算法对采集到的视频进行检测,不仅可以获取车辆、行人的基本信息,还可获取相应的流量信息,并预测其运动趋势。除此之外,我们还需对周围环境做出准确感知,因此通过图像分割技术来从道路图像中获取周围环境信息,从而区分行人、车辆、障碍物、车道线和可行驶区域等重要交通信息
初中历史学业水平考试(以下简称中考)作为义务教育阶段历史学科的总结性考试,也是高中教育选拔的重要依据,关注初高中衔接,反拨初中历史课程改革是中考的重要功能。《中国高考评价体系》提出"四层"考查内容以学科素养为导向,推动核心素养在高中教育中的落实,助推素质教育的发展。基于学段特征做好初高中衔接,引导初中阶段课程教学和评价从知识本位向素养本位的转变就成为当前中考改革的重要方向。近两年广东省中考历
期刊
光电成像技术是现如今信息获取和情报收集的重要手段,然而难以同时兼顾大视场与高分辨率成像的缺点制约了光电成像系统在新领域的应用。多尺度成像技术的提出在一定程度上解决了上述难题,但是仍存在其固有的缺陷:中心与边缘成像分辨率不一致,这个缺陷随系统视场增大而愈发严重。针对多尺度成像技术的缺陷,本文从多尺度成像原理与传统光学系统设计的角度出发,采用分视场分区域多焦距光学系统设计的方式,根据全视场内不同视场角
复杂环境下的多目标跟踪问题给雷达系统带来了巨大的挑战。目前主流的多目标跟踪方法都基于贝叶斯滤波理论框架。其中,基于随机有限集(Random Finite Set,RFS)的高斯混合概率假设密度(Gaussian Mixture Probability Hypothesis Density,GM-PHD)滤波算法在杂波环境中表现出良好的跟踪性能,对比传统基于数据关联的多目标跟踪算法,具有无数据关联、
近年来,由于深度学习的出现,人工智能在各个领域的飞速发展是有目共睹的。自然语言理解作为人工智能领域的热点研究方向之一也随之崛起。目前,市场上的对话设备层出不穷,但是对话系统在解决仪器设备的使用问题中的应用并不多。由于仪器设备的操作越来越复杂,不久的将来基于图像的对话帮助系统的研究会是一个不错的研究方向。相比纸质的帮助方式,图像结合对话的帮助方式能够更方便、更快速的解决用户使用设备时遇到的难题。本论
复杂多变的战场电磁环境给雷达系统的正常工作带来了极大的挑战。为削弱雷达对抗电子干扰的能力,电子干扰机常常采取变极化的工作方式达到干扰雷达正常工作的效果。本文主要针对干扰极化方式变化条件下天线交叉极化响应严重影响雷达自适应滤波技术这一问题,基于变极化干扰条件下,通过详细的公式推导,讨论了天线交叉极化响应引起雷达自适应滤波算法性能下降的本质原因,提出几种天线交叉极化响应影响下自适应滤波设计优化方法。仿
第五代(the fifth generation,5G)移动通信系统已经逐步推广。5G的性能目标主要分为高速率、低延迟、低功耗和低成本。为了适配5G早期的商用布置,国内外专家在Release-15中总结了5G规范的一阶段工作。而由Release-16所规划的二阶段工作于2020年4月完成。第五代无线通信系统有三项重要使能技术,即大规模天线阵列技术(Massive MIMO)、异构超密集网络(Het
冲突问题的合理解决一直是备受社会关注的课题。近年来,为揭示冲突问题的本质并进一步剖析冲突主体间的关系,学者们致力于冲突分析的研究并构建了众多冲突分析模型。然而,现有模型均未考虑冲突主体在决策过程中的谨慎心理。为解决这一问题,本文拟将三角模糊数应用到冲突分析的研究中,具体内容如下:首先,研究了三角模糊信息系统。为刻画代理的谨慎心理,本文为实际的冲突问题构建了三角模糊信息系统。基于建立的三角模糊信息系
学位
随着近十几年石油工业的发展,多数油气田都进入开发中后期,整装油气藏的开发逐渐减少,薄互层、断块、低渗等复杂油气藏成为油气田勘探开发的主要方向。目前定向测井技术可以实现地层界面、地层方位特征以及各向异性地层走向的预测和判断。电磁波电阻率测井是定向测井的关键技术,成为诸多学者的研究目标。本文针对某电磁波电阻率测井仪器的研制需求,设计了一款具有电磁波信号产生、信号采集、检测处理、通信控制等功能,兼有方位