复杂场景下的高精度目标跟踪算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:xjfox1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪是一种要求定位并持续跟踪视频片段中的目标的计算机视觉任务,由于在交通、医疗、安防等多个领域存在难以替代的应用价值,自诞生以来便广泛得到研究人员的关注。经过长期发展,目前主流目标跟踪算法可划分为两类:基于相关滤波的算法和基于深度学习的算法。前者兼顾优秀的运行效率和跟踪效果,后者则得益于神经网络强大的可塑性和海量训练数据,不断取得越来越瞩目的成绩。这两类算法均存在巨大的发展空间,同时也互相取长补短,共同推进着目标跟踪算法的发展。然而,当前目标跟踪任务中仍有许多等待研究人员攻克的难点,复杂场景下的高精度目标跟踪便是其中之一:真实应用环境的复杂性往往会对目标跟踪算法的决策产生干扰,影响算法的输出,威胁算法跟踪结果的精度。值得注意的是,当前目标跟踪算法研究中出现了以孪生网络为基础、融合视频目标分割以提升跟踪效果的算法,该算法利用神经网络得到目标的分割掩膜,据此生成跟踪结果。本文以该思路为基础设计旋转目标框生成解决方案,以此实现复杂场景下的高精度目标跟踪。该解决方案使用旋转目标框回归算法处理旋转目标框生成任务,涉及的工作可归纳如下:1.设计旋转目标框生成任务。对于融合视频目标分割的目标跟踪算法,为了方便研究高效精确的跟踪结果生成方法,本文将算法中根据目标掩膜生成旋转目标框这一图像处理步骤提炼为独立的任务,并定义统一的输入输出数据格式和评价标准,为围绕该任务研发的方法提供规范。2.旋转目标框生成任务的数据集开发。为了支持旋转目标框生成任务的研究,本文提供了相应的数据集。数据集图像来自于对现有公开数据集目标掩膜数据的加工,标注则使用算法依据图像数据自动生成。3.构造旋转目标框回归算法。本文引入神经网络回归方法处理旋转目标框生成任务,并探讨了该方法的可行性。得益于任务特性和本文提供的数据集的标注生成算法的特性,理论上旋转目标框回归算法可以帮助目标跟踪算法提升复杂场景下跟踪精度表现。4.旋转目标框回归算法实现。本文提供了旋转目标框回归算法的一个具体实现,可将其植入到现有的融合视频目标分割的目标跟踪算法中。该算法的数据处理方式确保其与现有目标跟踪算法的网络结构解耦,保证算法训练的独立性,方便植入和移植。对于该算法,本文基于不同思路构建了三种网络实现,使用了优化的损失函数。最后,在三种网络实现下,本文进行了完备的实验,测试算法训练方式的有效性,以及将该算法植入到现有目标跟踪算法后的跟踪效果。
其他文献
图像分割是计算机视觉与图像处理应用的关键基础,其研究目标是根据图像内在特征建立像素级标签,将其划分为不同的语义区域。随着深度学习技术的兴起,基于卷积神经网络的图像分割技术取得了阶段性突破。然而,现有方法主要基于图像局部特征到像素级标签的非线性映射,其成功依赖于成像清晰、规模庞大的高质量训练数据集,在众多实际应用中均难以获取。一方面,恶劣天气(如雨、雾)环境下采集的图像数据规模大,但能见度低,为精准
随着企业的发展,部门间的沟通与交流已占据了企业日常工作的大部分,普通电话、邮件、即时聊天、会议等形式的问题处理已不能满足企业日常工作中问题的及时性与有效性,目前工作上的问题已经制约着工厂的生产效率,各部门每天不得不花费大量的时间进行推诿扯皮。为了解决以上问题,建立一套专门用于问题处理与跟踪的系统尤为重要,于是开发了复材厂问题协调管理平台,该平台基于.NET框架,使用C#语言,选择使用Oracle数
人体步态作为一种生物身份识别特征,相比于人脸、指纹、声纹等,由于其具有不宜伪装,可接受性高,可以远距离获取等优点,因此在智能安防、刑事侦查等领域具有重要的潜在应用价值。然而,由于实际拍摄环境的复杂性,人体步态识别也面临着诸如拍摄角度,行走速度、携带物等多方面的挑战。在这其中,视频拍摄角度的不同会带来人体步态行走轮廓的明显变化,造成步态识别准确率的剧烈下降,严重阻碍了这项技术走向大规模工程应用。面对
毫米波与太赫兹频段的电磁波具有其他波长不具有的安全性、金属反射特性、非电离特性和非极性物质穿透性等,且其波长相对较短,可以实现更高的成像分辨率。因此,在毫米波与太赫兹波段进行成像系统的研究,这对军事勘测、医学成像、人体安检等领域都具有重要意义。在众多成像系统中,焦平面(FPA)成像无需额外机械扫描,具有便携、实时性强的特点,成为成像的主要方式。但是传统焦平面成像体积庞大、成本较高,难以实现实时成像
广元市公交车辆动态信息服务系统是一种智能交通系统,主要具有公交车辆信息管理、公交车排班调度、公交车辆运行动态信息跟踪、监控与展示等功能。该系统的建设符合广元市城市建设规划,对外提供公交车辆动态信息有利于人民群众安全和便利出行。广元市公交车辆动态信息服务系统项目是软件开发为主体,并集成通信、定位、监控视频等硬件的综合性项目,具有项目复杂性高、工期短、要求高和管理难度大的特点,因此本文选择该项目的项目
模糊图像超分辨率复原由于其实用性和可靠性,被广泛应用于军事,医疗,教育,侦察等领域,原有的模糊图像超分辨率复原方法由于技术的局限性,已经逐渐不能满足当下实际情形中图像复原质量的需求,因此研究如何提高模糊图像超分辨率复原的质量具有重要的意义。本研究在以模糊核估计算法和生成对抗网络模型为基础的传统模糊图像超分辨率复原模型上有如下创新工作:本研究提出了新的模糊核估计算法,该算法主要包括多尺寸模糊核估计,
自20世纪末物联网概念被提出并得到大力推广,无线通信技术及其应用在全球范围内再次掀起一番热潮。2.4 GHz作为通用无线工作频段,其在物联网系统中的产品开发及应用得到了快速的发展。其中,天线是无线信号收发装置的关键一环,天线性能的优劣直接决定了收发系统整体的工作能力。无线系统小型化的发展需求,将天线的小型化及信道数的拓展推向时下研究热点。可见天线小型化技术及多输入多输出(Multiple-Inpu
随着物联网技术的发展,万物互联变成现实。车联网作为物联网的一个重要分支,在安全驾驶、电子不停车收费系统(ETC)、智慧城市等方面发挥着重要的作用。为了保证上述应用的实施,越来越多的天线安装在汽车上。当天线安装在汽车上时,天线的辐射方向图将会受汽车的影响而发生变化,因此快速获取安装辐射方向图对于指导天线在汽车上的布局优化至关重要。若通过全波仿真求解天线的安装辐射方向图将会花费很长的计算时间,其次,出
会议的组织及实施在电力系统中是极为常见的事情,邮件及电话通知、纸质材料打印、手签签到表、大屏投影等传统手段依然是支持电力系统种类会议的重要手段。电力系统一直将信息化与智能化作为生产及管理中一个重要的支撑手段用来提升生产及管理的效率,因此通过一套较为便捷的会议管理系统软件来支撑电力系统的各类会议是非常必要的。本论文实现了一套基于Android平台的会议管理系统软件,从前期的需求调研到系统的设计、系统
近年来大尺寸高性能复合材料凭借优秀的性能在航空航天领域的使用比例大幅度提升,因此针对大尺寸航天复合材料缺陷的非接触无损检测技术研发具有重大意义。本文结合大尺寸复合材料原位、外场、整体缺陷的检测需求,运用红外热波成像技术对复合材料在热激励下温度场变化信息进行采集,得到红外图像序列,根据红外图像序列中的温度的变化特性与检测需求,最终实现了对大尺寸复合材料完整检测结果的呈现并实现缺陷的定量检测。在此基础