基于多示例空间聚合的行人重识别方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:accpaccp1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
受到细粒度的任务特性以及数据中存在的各种干扰因素的影响,行人重识别任务对算法提取到的特征的判别能力与抗干扰能力都有较高的要求。为此,本文在多示例空间聚合思想的基础上,分别从提升局部示例判别性、抗遮挡模式发现与身份属性信息学习三个方面展开研究工作。针对特征的判别能力与鲁棒性的问题,一种基于局部示例判别能力增强空间聚合方法被提出,在全局空间聚合的范式下,利用NetVLAD编码提高局部特征的判别能力,同时保证特征的鲁棒性与判别能力。此外,针对行人重识别与NetVLAD的特点,分别提出了用于提高特征判别能力的特征优化层、用于稳定NetVLAD训练的正则初始化方法以及用于结合低层细节信息与高层语义信息的多分辨率特征融合方法。针对遮挡场景下的行人重识别问题,一种基于预定义先验掩码的背景模式发现与抑制算法被提出。该算法通过丢弃关注背景的类心的输出来减少背景以及遮挡物对特征的影响。此外,一种训练-丢弃-微调的两阶段的训练方法被进一步的提出来减少丢弃背景类心带来的有判别能力特征的损失。针对行人重识别算法的监督学习方式,一种基于属性信息引导的行人重识别方法被提出。该方法在身份信息可用的强监督场景下可以对行人的身份信息形成良好的补充,在身份信息缺失的弱监督场景下也可以取得较好效果。在技术实现上,分别提出了用于对齐NetVLAD类心与属性标注局部性的基于类心加权融合的属性特征提取模块和用于平衡不同的属性的作用并融合身份特征的属性-身份特征融合模块。
其他文献
雨雪、雾霾等恶劣天气导致能见度下降、目标背景反差大幅劣化。图像感知增强方法从退化图像中恢复出清晰图像,从而提升目标场景视觉感知能力。然而真实场景中,天气退化复杂多样,且与目标背景动态混杂,难以直接获取退化前后成对样本进行学习建模。现有方法大多研究退化机理模型仿真图像,但因存在计算简化,仿真模型仍难以准确反映真实退化,仿真与实测样本存在明显差异,导致实测图像泛化困难。本文从真实数据生成、非成对实测退
学位
随着以碳化硅为代表的第三代半导体功率器件的兴起,高频化电机驱动系统的可行性大大增加。但高开关频率的特性使得原本就不能忽略的电磁干扰加剧,严重影响系统的可靠性和稳定性。因此,本文选题研究基于碳化硅的交流电机控制系统共模电磁干扰抑制策略。首先,论文研究了电机驱动系统的共模电压频域特性,分析了传导途径中两电平逆变电路主拓扑、线型阻抗网络和电机的主要寄生参数对共模电压的影响,并提取相应参数,进而建立数学模
学位
伴随着人口的大量涌入、机动车数量的激增,中国城市早晚高峰期的交通拥堵问题日益严峻,降低了城市交通可达性,影响城市发展。建设城市轨道交通(urban rail transit,简称URT),被认为是有效解决拥堵影响的途径之一。URT建设成本高,合理规划网络非常重要。为了指导网络规划,学者研究了URT网络的拓扑结构特征以及最优布局,然而,关于URT对城市高峰拥堵时刻的可达性影响的实证研究较少。开展这类
学位
自主水下潜航器(Autonomous Underwater vehicle,AUV)能够极大地拓宽人类在水下空间的能力边界、降低水下高危环境中的作业风险,因而在海洋观测、水雷清扫等领域获得了广泛的应用。但现阶段AUV的智能化水平远不能满足有人/无人协同作战、水下观测组网等新应用场景的需求,而高效、合理的路径规划技术则是提高其智能化水平的关键。路径规划算法需要充分考虑任务需求和自身的能力约束,并保证
学位
快速城市化使得路网结构与功能越发复杂,增加了城市中寻路路线的复杂性,提高了城市居民的出行难度。其中,寻路难度刻画了城市中寻路路线的复杂程度,可以用描述起止点之间特定路线的信息量进行量化。为了提升人们出行的舒适度和安全性,需要深入地了解影响城市路网寻路难度的关键因素,设计寻路难度的降低措施,用于指导、启发城市路网规划,改进、完善当前的导航工具。基于此,本文从信息熵视角出发,量化城市路网的寻路难度,探
学位
现阶段深度学习主要根据数据的预处理以及按照经验搭建网络结构,让学习任务达到令人满意的地步,然而针对不同的学习任务,搭建合适的深度神经网络是比较复杂的。近几年,逐渐有很多学者开始大胆猜测,对于常规的残差神经网络模块可以看成是一种偏微分方程,其中Ruthotto、Haber、林宙晨等人针对这种想法进行了相关研究。本文主要针对热传导型残差神经网络模型和对流扩散型残差神经网络模型做相关的研究。实验一和实验
学位
随钻核磁共振测井技术(Logging While Drilling-Nuclear Magnetic Resonance,LWD-NMR)由于其独特的属性,对于识别储层流体类型、评估产能及测量地层与岩性无关的孔隙度、渗透率等信息具有重大意义。面向随钻核磁共振测井仪器的多物理场参数测量、回波采集、数据处理及存储等需求,设计随钻核磁共振测井仪的主控电路,采用双核DSP+FPGA的多核协同架构,实现仪器
学位
医学影像可以显示人体各部分解剖结构和代谢情况,辅助医师进行病灶定位、诊断鉴别、病情评估等。临床诊断常用的医学成像技术有X光透视、电子计算机断层摄影(CT)、正电子发射断层扫描(PET)、磁共振成像(MRI)、超声成像等。近年来深度学习技术被广泛应用到医学图像分割任务,其中多模分割通过将来自不同模态医学图像的特征信息进行融合和转化,充分利用不同成像方式的医学图像或数据集中的信息,提高分析的准确性。目
学位
图文联合表征是指对图像和文本信息进行联合语义表示。图像和文本是常见的两种模态,同时模态间的联合表征是支持下游任务的基础。因此图文联合表征是多模态领域最重要的研究课题之一。然而,由于图像文本之间存在信息粒度差异与语义匹配歧义,使得图文特征抽取和语义交互面临诸多困难。论文重点研究图文信息的特征抽取与语义交互,以提升图文检索的召回率,同时研究和实现了论文方法在工业系统中的应用。在图像文本信息嵌入方面,主
学位
近年来,随着硬件设备和人工智能的不断发展,智能视频监控得到了广泛的应用,学者们对监控领域算法一直在不断挖掘和突破。本文针对家庭安防监控中的在线动作检测(Online Action Detection,OAD)算法进行了研究,根据任务特点提出了新的网络框架,并取得了较显著的性能提升。另外,本文针对家庭安防监控设计了基于树莓派的硬件监控平台,为算法的实际应用奠定了硬件基础。目前大多数的OAD算法使用单
学位