基于深度学习的车辆再识别方法研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:Ricky_C
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
车辆再识别作为智慧城市的核心技术之一,目的是在多个不重叠的相机视图中检索出感兴趣的车辆。当前突出的算法通常先对数据集进行大量的人工标注,让模型在额外标注的辅助下,能够更精确的关注到局部细节信息,进而提升最终的测试性能。但是额外的人工标注不仅十分耗费资源,还会降低模型的泛化能力。针对以上问题,本文在福建省与福州市重点科技项目(2018H0018、2020-GX-17)的支持下,围绕基于深度学习的车辆再识别算法展开研究,以减少人工标注和提升模型泛化能力为目标,分别从监督学习和无监督学习两大领域入手。主要的研究工作如下:一、提出双分支区域感知模型来减少车辆再识别的额外标注。其中,该模型的全局分支将Res Net-50作为主干网络,并通过原图提取相应的全局特征。局部分支则是由特殊设计的浅层子网模块、多分辨率模块和注意力模块整合而成,并采用Mask R-CNN分割后的前景图作为输入。首先利用前景图能够克服一定的背景干扰,再经过浅层子网模块使模型关注一些比较重要的浅层局部信息;紧接着利用多分辨率模块来集中处理这些局部的区域特征,让模型在充分提取高级语义特征的同时,又尽可能保留一些局部的细节信息。最后,通过注意力模块来对不同空间位置上的特征进行增强或抑制。模型采用Circle loss和Triplet loss组合的新型损失函数进行优化,能够达到更好的效果。在没有额外标注的前提下,通过特殊设计的局部分支可以自适应的提取多语义层次的视不变特征。此外,对数据集Ve Ri-776进行的实验发现,将前景图提取的局部特征和原图提取的全局特征相融合,所得到的特征向量能取得最好的测试效果,证明了车辆再识别中的前景图和原图是相辅相成的。二、提出基于合成数据消除跨域偏差的车辆再识别框架。虽然上述第一种方法仅用ID标签就能取得很好的效果,但模型始终依赖于有效的监督标签,不符合实际应用的要求。由于车辆外观在不同视角下呈现出巨大的变化,且不同数据集之间的分布差异较大,将车辆再识别模型部署到无标签的数据集上并获取较好的性能是一个巨大的难题。基于上述问题,本文在车辆再识别领域首次利用合成数据来辅助无监督任务。对于合成数据的运用:先让合成数据通过数据自适应模块生成与目标域相似的伪目标样本,再用伪目标样本进行模型的预训练,增强模型对目标域数据的适应能力。接着,用合成数据训练的方向模型和相机模型对最终的特征向量进行校正,以减小相似背景和相同车辆方向所带来的负面影响。实验证明该方法在领域自适应和完全无监督两个任务上均能取得优秀的性能。综上所述,本文主要针对监督学习和无监督学习两个领域存在的问题提出了相应的解决方法,本文所设计的框架系统对于未来车辆再识别的发展具有一定的启发和应用价值。
其他文献
随着物联网技术的发展和人工智能的普及,网络中的边缘设备数量呈指数式增长,这些设备每时每刻都在产生大量的数据,对这些数据的分析和利用有利于信息化的发展。然而,传统对这些数据集中化处理的方法通常伴随着庞大的存储问题和复杂的计算问题。首先,庞大的数据量对网络传输能力要求较高,且会带来网络时延等问题,因此将数据处理从云端下沉到边缘端的趋势无法避免;其次,随着企业及用户对个人隐私意识的不断增强,使其对个人数
学位
阿尔茨海默病(Alzheimer’s Disease,AD)是最常见的痴呆症之一。大量先前的研究结果表明将不同模态的数据结合起来用于脑部疾病的诊断,通常比仅仅使用单一模态的诊断结果更好。但在临床实际中很难获得包含不同模态数据的完整数据集。PET成像价格昂贵并且需要注射放射性物质,而MRI成像则更便宜、更安全,在实际中应用更广泛。因此,在同一研究对象的多模态数据中经常会缺失PET数据。对于多模态数据
学位
随着农业现代化建设的快速发展,温室大棚管理也朝着智能化方向发展。目前国内温室大棚监控系统管理较为依赖主观经验,并且,数据的收集管理较为复杂,系统无法实现较好的远程监控。此外,温室大棚管理智能化不足和大棚内布线复杂等难题需进一步解决。因此,提高温室大棚智能化程度,建立自供电监控系统具有重要的实际意义。本课题从实际应用角度出发,研发出一套由光伏供电的温室大棚监控系统。该系统采用光伏供能,利用无线传输将
学位
视频压缩技术已显著节约了视频的存储空间和传输带宽,但过度压缩会不可避免地导致压缩效应的出现。实验表明,相关压缩效应的存在显著降低了视频的画质,并严重影响了终端用户的观看体验。为解决此问题,需探讨压缩效应与视频质量之间的相关性,并以此为基础,构建压缩视频质量的客观评价指标。其中,无参考的质量评价方法更加切合于用户端的观看环境,也因此成为当前研究的重点与难点。就此,本文定性研究了压缩效应与视频质量之间
学位
现如今虚拟现实技术发展显著且应用度广,全景视频作为其中的一种技术在虚拟现实研究中占据重要地位。全景视频是把全景和视频相结合的一门综合技术。与传统视频的单一视角对比,全景视频能够提供宽广的视野,还可以观看任意方向的内容,有良好的沉浸感和使用价值。现如今直播的盛行,全景视频在娱乐、旅游、交通等方面都得到了一定程度的应用。将全景视频与直播相结合,实现全景视频直播,势必将成为今后社会的一大热门。实时性和画
学位
对于多媒体服务而言,触觉感知愈发重要。触觉感知融合音频和视频,可以构建更具沉浸式的多媒体用户体验。随着触觉感知需求及相关软硬件交互设备的发展,需要传输的触觉数据规模越来越大。为支撑媒体流的传输和触觉感知信号的再现,触觉感知编解码技术显得尤为必要。但现阶段触觉感知信号的研究还未达到较高水平,特别是该领域的编解码方案压缩性能有限。为解决该问题,本文分析了动觉信号,即触觉感知信号的两种主要类型之一,发现
学位
伴随着科技的进步,医疗环境的改善,肺癌的死亡率和发病率都有所下降,但数据表明肺癌的死亡人数依然占据癌症死亡和发病人数排行榜的首位或次位。在肺癌的检查和诊断中,肺结节是肺癌的表现形式,当肺结节呈恶性时,就表明病人患上了肺癌。肺癌的形成是一个漫长的过程,是多种因素导致的过程,有早期、中期和晚期之分,通常认为肺癌早期的生存率更高,因此肺结节的“早发现,早治疗”就显得尤为重要。本文围绕肺结节的检测与分类展
学位
步态是指人体行走时的姿态,也可以说是人体运动过程中的一种生物特征。其中包含了大量的运动信息,这些信息可以应用于生物认证、临床、人机交互等多个领域。在临床方面,步态分析主要用于辅助医生对正常步态和异常步态进行辨识以及帮助病人进行康复训练。髌骨疼痛综合症(PFPS)是一种临床上最为常见的膝关节疾病,患者会因疼痛而导致异常步态。我国髌骨疼痛患者数量庞大,早期并精确地检测出髌骨疼痛可以防止该疾病的进一步恶
学位
为了实现便捷的充电,以无线能量传输技术为基础的无线充电方式引起人们的广泛关注,并成为当前研究的热点。由于电池的物理特性,负载参数如阻抗在充电过程不可避免会发生变化,为了实现负载恒流充电,需要设计补偿网络进行调整。为了解决多负载、多中继、中继混合负载传输环境下负载恒流的问题,本文基于T型补偿拓扑网络,搭建了无线充电中继传输的研究模型,并结合三种实际应用场景展开研究,主要的研究工作和贡献概述如下:(1
学位
森林地表火蔓延是森林火灾的重要形式,风作为影响林火蔓延的重要因素备受研究者的关注。风是动态因子,主导林火的蔓延速度和方向,它与林火之间存在复杂的双向耦合作用。然而,传统的林火蔓延模拟系统并不考虑这一作用,导致模拟的准确性和真实性不足,而现有的林火-风双向耦合模拟方法又存在计算量大、耗时长等问题。为解决这些问题,本课题研究并提出一种全新的林火-风双向耦合模拟方法,同时搭建一套微尺度风数据采集平台,并
学位