基于属性学习的车辆再识别研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:wb2062182
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,中国经济发展逐步趋于稳定,绝大部分家庭均选用了汽车这一交通工具,从而使我国的汽车保有量稳步上升,但随之面临的各类交通问题也是与日俱增。为了解决这些实际交通问题,车辆再识别技术应运而生并逐渐走入人们的视野中。然而,仅仅通过车辆的颜色或车型等部分单一的车辆属性来进行车辆重识别很难取得较高的准确率。再加上真实场景下例如不明物体的遮挡、分辨率低、角度变化等诸多外界因素的影响,使得车辆重识别要想获得较高的准确率更是难上加难。针对于这些问题,本文借此入手,在传统的车辆再识别模型上加以改进并进行了优化。主要进行的主要工作有如下几个方面:(1)基于轻量型网络OSNet构建了一个基于属性特征的车辆再识别模型。由于传统网络的主干部分采用的是残差网络(Resnet-50)网络的前三个Block,该基础网络的参数过多,而且还有分支网络,结构相对复杂,这些因素导致原本的深度学习模型,在实际训练过程中无法达到预期的速度,而且训练效果不佳,在此情况下,本文针对传统网络结构的弊端,在原本的数据集上设计了一个基于轻量型网络OSNet的车辆再识别框架,取代了原有的Res Net网络。本文提出的方法将利用优化后的算法框架和网络模型加以训练。从最后的实验数据可中不难看出,与原始的模型相比较,基于OSNet的车辆再识别网络模型使得训练的准确率有明显的提升。(2)构造基于多任务学习的车辆重识别算法。利用单一的卷积神经网络来提取目标的特征是传统的车辆再识别应用最多的方法之一,该方法通常先将复杂任务分解成为不相干的多个任务,随后再对每个任务进行学习。但多任务学习与之不同的是,它能够把不同任务间的训练数据汇集在一起。本文提出的框架中,每一个分支都将用于属性识别,该模型的整体结构是属于三个分支的一种车辆再识别模型。随后,该框架再联合同时训练多个不同任务的模型参数,以此来提高模型的学习能力,同时还可以提升模型的泛化性;使用交叉熵损失(cross entropy)与补充损失(complement entropy)相结合COT(Complement Objective Training)方法,将其它类别所预测得到的概率均匀分布到每个类中,再将预测到正确类别的概率尽可能地做到最大化,以此方法来优化训练结果。实验结果显示,相对于原有的仅通过交叉熵损失函数的算法,本文提出的方法在Ve Ri-776数据集上能有效提升车辆再识别的检测准确率。同时,本文的算法与其它算法也进行了横向对比,通过最终的实验数据能够很直观地看到改进后的算法框架与网络模型获得了更加优异的识别性能,从而证明了该方法的有效性。
其他文献
情绪识别是近年来人工智能的一个研究热点,也是一个难点。人的情绪会通过面部表情、语音、身体姿态等不同模态表达出来。目前,有关静态面部表情和语音的情绪分类研究比较多,但基于面部表情及头部姿态的多模态情绪识别研究相对较少。课题研究了面部表情和头部姿态这两种模态的情绪表达特征,利用宽度学习(Broad Learning System,BLS)算法建立了基于这两种模态特征的情绪识别模型,并在公开的情绪视频数
复合式VTOL无人机为最近比较火热的无人机机型,以其独特的四旋翼加固定翼的结构特点应用在诸多领域,复合式无人机结合了四旋翼和固定翼的特点,既可垂直起降,又可以进行平直飞行,大大减少了无人机对地形或者其它环境的依赖,其在最近几年得到快速的发展。由于复合式无人机近年来需求的增长,对复合式无人机的研究和制造就成了重中之重,直接利用一个实体无人机进行实验可以给我们最佳的反馈,但是由于极高的造价,导致我们不
下肢辅助运动装置是一种便携式可穿戴智能设备,它将人的下肢与机器结构巧妙的结合起来,能够为人体提供支持保护,同时也能够辅助人体完成步行等行为。按照功能的不同,可以分为:致力于解决下肢运动能力丧失或者严重损伤患者的运动问题的康复类型的辅助运动装置和增强人体负载能力的辅助运动设备。本课题围绕下肢辅助运动装置控制系统进行研究,主要做了以下工作:(1)通过研究有关人体下肢辅助机器人文献资料,总结了下肢辅助运
网络化控制系统是将控制器、执行器与传感器通过通信网络连接起来的一种分布式控制系统,具有远程和大范围控制、便于安装和维护、移动性强等优点。由于通信网络特别是无线网络的开放性和保护不足,通过网络传输的数据很容易被窃取,甚至遭到恶意攻击者的破坏。因此,本文从控制安全的角度研究了网络化控制系统中虚假数据注入攻击的设计、检测和分析问题,主要研究工作如下:(1)针对网络化控制系统反馈通道测量数据和前向通道控制
图像分类旨在判断输入图像所属类别,是计算机视觉四大基本任务之一,单分类(one-class classification)是针对数据集中只包含一种类别样本的分类问题,在实际场景中的应用十分广泛。近年来随着深度学习理论的发展,许多优秀的分类网络被提出用来解决单类分类问题。但在实际应用中,分类器的分类效果常常会受到复杂背景、数据样本集小、目标在图像中的占比小等诸多因素影响,效果还不是很理想,基于深度学
网络购物时代的来临,使得物流运输业变得日益重要,日常小件货物的分拣、存放、运输等问题也越来越突出,其中必然会涉及物体的重量和尺寸信息。尺寸信息也就是物体的体积。如何智能化、自动化地获取物体的体积信息是亟待解决的问题。而已有的视觉测量技术,大多需要人工进行物体的定位检测、识别以及角点、边缘线等的提取,考虑到近年来深度学习理论在物体识别等方面的成功应用,本文以此为研究背景,系统探讨了在深度学习框架下利
目标跟踪广泛应用于智能家居、医学诊断、交通视频监管等多个领域。随着相关滤波、深度学习的理论知识和计算机存储设备的迅速发展,判别式跟踪算法逐渐成为目标跟踪领域的主要发展趋势。判别式跟踪算法将目标跟踪问题转变成跟踪的目标与背景之间的二分类问题。因此算法先利用正负样本训练前景与背景的分类器,然后用该分类器在后续帧中找到最优目标区域。判别式跟踪算法的核心是目标定位、尺度以及速度三个问题,本文在判别预测模型
为了满足人们的精神文化需要,尤其是影音娱乐方面,超高清技术正处于大力发展阶段。但由于成像硬件设备的价格高昂,靠提升硬件来提高清晰度显然是无法大面积实行的。随着近些年深度学习的发展,依靠神经网络来进行超分辨率重构已经如火如荼,其不光成本低廉、便于部署,且重构效果已经超越了很多传统算法。超分辨率,其目标是从低分辨率图像中尽可能的恢复更多的细节信息,使图像变得更清晰,更容易被人眼所接受。针对单帧图像超分
随着大数据时代的到来,计算机与移动网络的飞速发展。我们已经迎来了5G网络,人们获取信息的途径越来越多,每天数以亿计的信息留存于互联网上。丰富的信息资源在互联网上构建了一个大型知识库满足人们对未知信息的渴望。但是,庞大的信息量也让人们很难快速得到有价值的信息,如何快速筛选有价值的信息是当前亟待解决的难题。自动问答系统可以根据用户所提出的问题,自动挖掘问题的语义信息,并快速匹配得到问题的正确答案反馈给
地基合成孔径雷达(Ground-based Synthetic Aperture Radar,地基SAR)系统具有非接触、高精度、大区域连续监测的技术优势,是进行区域性监测、地表形变监测以及定点连续测量的重要手段。传统地基SAR图像多源数据融合算法,一般基于坐标转换或特征匹配的方法实现,需要人工提取地基SAR系统、监测点坐标进行转换计算,难以实现自动化。利用生成对抗网络模型也可以实现地基SAR图像