基于卷积神经网络的行人重识别算法研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:instant
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别(Person re-identification)是指在非重叠监控视域下,对当前拍摄到的目标行人在其他视角域下进行再识别的技术。这项技术目前在刑侦破案等方面已经得到广泛应用,特别是在防范打击国际恐怖活动的任务中,能够从海量的图像或视频库中迅速匹配锁定犯罪嫌疑人,大大提升了公安部门的破案效率。然而,在真实场景应用中,不同监控设备所拍摄到的行人图像存在着分辨率、拍摄角度、光照强度的差异以及行人姿态变化等多种干扰因素,这些都很大程度上影响了行人重识别模型的识别性能。因此,如何改善这些因素造成的不利影响,成为了目前行人重识别研究中亟待解决的问题。随着深度学习的不断发展,如何利用深度学习技术提高行人重识别的性能已经成为了具有重要应用价值的研究课题。对于基于卷积神经网络的行人重识别,其性能主要与采用的损失函数和网络结构有关。为此,本文主要工作将从损失函数和网络结构两个方面进行研究:(1)考虑到分类损失函数与度量学习损失函数在指导深度特征学习方面存在互补性,本文提出了一种基于组合损失函数的行人重识别算法。该算法采用的组合损失能够通过Proxy NCA++度量学习损失增强样本在嵌入空间中的类内紧致性,同时通过使用Softmax交叉熵损失提高学习特征的类别判别力。此外,提出的算法采用预训练的Res Net50模型作为主干网络来学习行人图像的深度特征。为了训练网络模型的参数,本文使用优化算法Adam最小化组合损失,采用随机水平翻转和随机擦除等数据增强技术克服过拟合。Market1501、Duke MTMC、CUHK03和MSMT17四个数据集上的实验结果表明,基于组合损失函数的行人重识别算法具有较高的识别准确率和较好的泛化性能。(2)考虑到不同图像中行人间的姿态存在巨大变化,本文提出了一种基于注意力和姿态估计的行人重识别算法。该算法中的注意力判别模块,能够自适应地学习每个通道和空间维度上特征的权值重要性,并将其作用于全局特征向量获得鲁棒性好、判别性强的全局特征向量。另一个姿态增强模块,能够基于关键点位置信息对图像进行前景特征增强,并对行人部件进行局部特征划分。两个网络模块分别从提取行人图像的全局特征及局部特征出发,共同优化构成了多粒度的端到端的网络模型。此外,提出的算法中采用预训练的Res Net50模型作为主干网络来学习行人图像的深度特征,并使用Adam优化算法最小化损失函数。Market-1501和Duke MTMC-re ID两个数据集上的实验结果表明提出的算法能够获得较好的检索性能。
其他文献
能源作为经济社会发展的重要因素,在推动经济总量扩张的同时带来了严重的环境问题,而环境恶化和资源过度消耗又反过来阻碍经济增长,甚至导致经济全面衰退。为应对与能源使用相关的环境问题,全球各国进行了多次协商并提出多种节能减排的可行性方案。中国政府也公开承诺了一系列节能减排目标,作为世界上最大的能源消费和碳排放国家,中国能否实现节能减排目标是决定世界节能减排行动成败的关键。在节能减排政策的实施中,提高能源
学位
乳腺癌是影响全球女性健康最常见的恶性肿瘤之一,给全球女性带来了严重的影响。目前早期筛查依旧是控制乳腺癌发展的最有效手段。最近几年研究表明,乳腺癌的分子表型对病人的预后具有指导性的作用。因此,通过乳腺癌的分子表型初步判断乳腺癌的分子分型进行患者的预后分析具有重要的临床指导意义。本研究通过将MRI(Magnetic Resonance Imaging,MRI)影像组学特征和生物标志物关联,找出关键特征
学位
插入变异指的是一段新的或已经存在的碱基序列由于突变增加到DNA序列中,而且与某些遗传性疾病有着重要关系,近几年已经成为一个研究热点。插入变异的检测可以通过第二或者第三代测序数据,然而目前基于第三代测序技术的数据集错误率较高,相关技术仍然不成熟,所以本文主要研究基于二代测序数据分析的新插入变异检测方法。本文提出了两种方法,一种是基于局部组装和重比对的方法,另一种基于综合比对信息以确定精确断点的方法。
学位
随着互联网技术的发展,尤其是以移动互联网为代表的快速发展,使得互联网用户数量产生了爆炸式的增长,也导致互联网上产生了越来越多的数据。每天新产生的数据已经达到了艾字节(EB)级。如此多数据,其中的大部分是文本数据,使得人工处理极为困难。这些文本数据蕴含着丰富的信息,理论上有着很高的价值,但这些数据因为非结构化的属性,使得传统的计算机方法难以对其进行有效的处理及利用。因此人们迫切地需要新的方法来让计算
学位
临近天气预报的高效性、及时性和准确性,在气象领域具有至关重要的作用。多普勒天气雷达回波图像作为临近预报的主要参考资料之一,天气雷达回波图像预测一直是临近预报中的一个研究热点。预测的相关算法被称为雷达回波外推算法,其主要任务是根据历史的雷达回波数据对未来一段时间内的天气雷达回波的生消演变和强度情况进行预测。传统外推算法对历史的雷达回波数据利用率较低。在回波比较零散,回波发生合并、分裂时,或者回波状态
学位
优秀的民族精神作为一种精神力量,具有正向、积极、向上等特点,对人们的实践活动具有重要的推动作用。改革开放后,我国经济快速发展,重大事故灾难的数量一直居高不下,暴露出我国应急管理体系还不完善、应急管理水平和能力有待提升等问题。对重大事故灾难中的民族精神进行研究,有助于进一步拓展民族精神理论的基础性研究,更好地坚持中华民族精神正确的发展方向,进一步完善应急管理理论,同时有利于进一步弘扬和培育优秀的中华
学位
随着信息系统主、客体规模日趋膨胀,制定和维护一个符合系统功能与安全需求的RBAC角色体系,对于系统安全管理员来说具有很大的挑战。为了应对这一问题,自动化或半自动化的角色工程方法受到了广大学者的关注与研究。传统的基于概念格的角色探索方法具有主动获取系统角色的特点,在角色工程方法中占据独特的地位。然而,随着效率与适应性要求的提升,该方法在时间复杂度和应用场景上存在以下三点不足:第一,传统的基于概念格的
学位
改革开放以来,中国经济实现跨越式发展,取得举世瞩目的成就。中国人均可支配收入逐年增加,城乡收入差距不断缩小。中国中等收入群体的规模不断扩大,已经拥有世界上最大的中等收入群体规模,成为我国经济发展的主体部分。伴随着收入的增加,居民的生活能源消费需求不断增加。收入水平的提高也增强了居民的节约能源及环境保护意识,并为节能产品的研发提供了资金支持。能源并不是取之不尽用之不竭的,如果无节制的开发,那么自然界
学位
在场景图像中对文字的位置进行检测,这是计算机视觉技术领域内的一个重要研究方向,在无人驾驶、票据分析、车牌识别、盲人导航、无人超市等各种应用场景里都有着十分重要的研究意义。与传统的光学字符识别(Optical Character Recognition,OCR)任务相比,在场景图像中的文字通常都有着颜色多样、字体大小不统一、背景信息复杂、文字表面遮挡、图像拍摄模糊、分辨率低等诸多影响因素,这些影响因
学位
近年来,随着中国经济的快速发展和城市化进程的不断加快,大气污染对空气质量和气候变化的影响日益显著,已成为关系到国计民生的重大问题。二氧化氮(NO2)作为传统光化学烟雾的代表性污染物和重要的痕量气体,在对流层大气化学中起着重要的作用。它不仅会形成雾霾、酸雨等环境问题,而且也会对人体健康产生很大危害。因此,本文基于卫星遥感和目标检测技术,以河南省区域为例,对NO2污染物时空分布特征及其影响因素进行研究
学位