基于姿态引导的车辆重识别方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:jushicahgn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智慧城市的建设,智能交通视频监控成为了日益重要的核心环节。车辆重识别(VehicleRe-identification,简称车辆Re-ID)是智能交通视频分析中的一项新兴技术,正逐渐成为研究热点。车辆重识别的主要任务是在多个非重叠覆盖摄像头的监控网络中在快速检索、定位到目标车辆。在真实开放的交通监控场景中,环境光照的变化、摄像头分辨率低、遮挡等不可控因素使得从视频中难以准确的获取车辆的车牌信息。不利用车牌信息的车辆重识别面临着巨大的挑战,例如不同的车辆可能具有相似的外观,而同一辆车在不同的姿态或视点下可能外观差异甚大。围绕这些问题,本文受到相关研究工作的启发,提出了一种基于姿态引导的车辆重识别研究方法。本文具体内容如下:
  1.本文研究了提取对车辆姿态变化鲁棒的视觉特征方法,设计了基于姿态引导的视觉模型KPGEV,其中包含利用了基于车辆骨架关键点的姿态分类器来提取车辆姿态特征和判断姿态类别。本文发现同一辆车在不同姿态下的视觉特征距离可能会大于不同车辆在同一姿态下的视觉特征距离,从而导致身份判别存在误差。因此引入了基于姿态引导的损失函数PG-Triplet在线挖掘同一姿态和不同姿态下的困难样本对,指导车辆全局特征和姿态特征自适应融合,得到对姿态变化鲁棒的视觉特征。该视觉方法在公开数据集上的mAP指标可达到60%以上。
  2.本文提出了一种基于车辆姿态引导时空约束模型的方法KPGST,通过挖掘车辆姿态与时空分布之间的关系来优化时空约束模型。该方法的设计动机是基于车辆连续通过多个摄像头时的运动方向应该是保持一致的。KPGST方法结合了车辆姿态和摄像头拍摄方向来估计车辆运动方向,基于车辆相对运动方向一致性和摄像头拓扑关系从而来引导时空约束模型。在公开数据集上,通过对比实验证明了该方法的有效性。最后,本文基于贝叶斯概率将视觉方法和时空方法进行了融合,从而提出了一个统一的车辆重识别框架。通过与目前研究方法的结果进行了多组对比,验证了该重识别框架具有高效性和先进性,在公开数据集上的mAP指标可达到75%以上。本文研究成果对智能监控、智慧交通领域有积极意义。
其他文献
随着在线流媒体服务需求的飞速增长,如今视频流媒体平台变得越来越流行,用户对低延迟和高质量服务的需求越来越大。高度多样化的内容使得在边缘服务器缓存空间有限的情况下不可能将所有需要的内容都存储在边缘。因此,如何分配缓存资源来服务尽可能多的请求,同时进一步减少传递延迟和带宽使用量,并提高用户体验质量,成为亟待解决的问题。边缘服务器有限的覆盖范围、用户移动性和请求模式的高度不确定也给服务部署带来了新的挑战
近年来,物联网、云计算、边缘计算等技术发展迅速,越来越多的资源受限智能终端设备出现在人们的日常生活中,并被广泛应用在交通、能源、物流、医疗、智慧城市、娱乐和社交媒体等场景中。通过应用区块链技术,可以有效保障这些存在资源受限设备的场景中数据的安全性与隐私性。但区块链技术本身对资源有较大的需求,而资源受限设备上的计算、存储、带宽等资源并不丰富,难以负担区块链共识过程以及存储区块链账本所带来的开销,这就
水泥工业的智能化对水泥生产尤其是水泥熟料生产至关重要,由此将水泥熟料生产领域的知识信息化,构建一个水泥熟料生产领域的知识图谱是一个亟待解决的问题。由于水泥熟料生产领域的知识量巨大且涉及范围很广,在广泛研究、项目积累以及与领域专家讨论基础上,构建术语库并搜集水泥熟料生产领域的数据。结合搜集的水泥熟料生产领域的数据,进行实体识别和实体关系抽取来提取数据中的知识信息,再将提取的知识构建成水泥熟料生产领域
图像生成技术作为艺术创作的重要组成部分,一直以来是计算机视觉的研究热点。传统的非真实感绘制技术利用计算机图形学、图像滤波等方法自动或者半自动地完成图像生成任务,这类方法只能生成简单粗略的图像,在生成图像的细节上做得不够准确。随着深度学习的迅猛发展,神经网络给该领域带来了革命性的改变。得益于更充足的数据量、更复杂的数学模型和更深层的网络结构,基于深度学习的图像生成算法不仅能够生成更复杂逼真的自然图像
共享单车作为一种绿色低碳的出行方式,给人们的出行带来便利。然而,人们自由使用单车给共享单车的维护带来许多问题(例如单车损坏、运送到指定位置等)。因此,共享单车平台可能需要雇佣用户去完成单车维护任务,同时平台需要给予用户合理的报酬以激励用户完成任务。当存在多个用户竞争时,用户可能谎报任务完成成本或者任务完成概率等信息来获得更高的报酬,从而导致平台不能高效的分发单车维护任务。本文主要从两个方面解决此问
小麦是现今世界范围内的主要粮食作物之一。为了提高小麦产量,育种专家致力于发掘其基因型和表型之间的联系。现有的表型提取方法多依赖于手工方式,采集的数据量有限且效率低下。三维CT(Computed Tomography)成像具有成像精细、动态范围高和无损探测内部结构等优点,可以快速且无损地提取小麦的高通量表型。CT扫描出的三维图像具有数据量大且内容高度稀疏化的特点,给图像处理工作带来了不小的挑战。本文
随着无线通信技术的日益成熟以及智能终端的普及,基于位置服务的应用(LBS)得到了全面的发展。用户在进行位置服务相关的查询时,需要向LBS服务提供商提供用户自身的请求内容以及位置信息,因此用户的隐私存在泄漏的风险。基于位置服务的隐私保护问题已经成为学者们研究的一个热点。当前主流的位置隐私保护模型所存在的缺陷包含:点对点分布式模型结构(P2P)用户之间存在不可信任的问题,响应时间较长,反馈结果不精确;
学位
拼车出行作为一种经济的出行方式,吸引了越来越多的乘客使用。如何有效地将乘客的订单分配给合适的司机成为了关键问题。为了给予司机更加合理的报酬,激励司机提供拼车出行服务,本文将对拼车出行中订单分配和司机定价的机制进行研究。在拼车出行中,司机是理性的,且具有异质性(例如不同的司机具有不同的成本信息),并会通过策略性行为(例如虚假地揭露自己的成本信息)去获得更多的利润。司机的策略性行为会造成平台和司机的社
学位
源代码摘要旨在生成自然语言文本,用于描述代码的语义。该任务目前已是软件工程领域不可或缺的部分。尽管现存的方法以能很好地完成此项任务,但是此类模型主要受限于数据充足的背景,而缺乏对于小样本数据和跨语言场景下的讨论。这些模型在实际应用中存在2个问题:(a)训练样本需求大。大多数主流方法中都采用编码器-解码器结构,而此种结构严重依赖于大规模数据训练。而且在现实世界中,获取大样本的优质标记数据集的成本是难
交通标志的检测与识别是智能交通系统领域中的重要研究方向之一,受到许多研究者的关注,但现有的研究主要集中在各类符号型交通标志的检测与识别上,对字符型交通标志的研究较少,且相关研究的检测精度与实时性不能满足实际需求。在实际的交通场景中字符型交通标志大量存在,以文字内容的形式提供丰富且重要的道路信息,这类文本信息的高效精准提取对于智能辅助驾驶系统、无人驾驶技术等具有重要作用。本文结合图像处理与深度学习最
学位