基于多层对抗孪生网络的单目标跟踪算法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:long060112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的进步,面向视觉单目标跟踪应用的软硬件技术得到飞速发展。然而,在复杂多变的实际应用场景中,视觉单目标跟踪技术也面临诸多挑战,如:目标的遮挡、形变等。另一方面,一些特定的场景对视觉目标跟踪的处理速度提出了更高的要求,这也阻碍了单目标跟踪的进一步推广。因此,设计一个面向实际应用场景的跟踪器对单目标跟踪技术的发展具有重要的推动作用。深度神经网络是近年来视觉单目标跟踪领域备受关注的技术手段,该类方法通过学习大量标签数据的跟踪过程,离线或在线地推理目标在连续视频帧中的位置,达到目标跟踪的目的。纵观深度神经网络的诸多模型,简单的离线网络缺少较好的泛化能力,跟踪的精度往往较低;对于一般的在线网络,实时调整网络参数又造成大量时间的流失,很难达到实时跟踪的要求。本文聚焦视觉单目标跟踪实际应用场景,从主流的深度网络模型中选择了速度和精度都适中的全卷积孪生网络,并从以下两个方面进行改进:针对传统全卷积孪生网络输入中含有大量背景的问题,本文设计一种轻量级的通道注意力算法,过滤目标区域的背景特征,并配合Inception结构增强不同尺度的有效特征。模型在降低网络中固有缺陷的同时,又提高了网络的特征提取能力。在此基础上,又提出不同深度特征融合的sum-and-max算法,使最终得到的响应图能够更准确的定位目标,提高模型跟踪的精确度。在OTB基准测试上的结果表明本文提出的视觉目标跟踪器在精确性上得到一定的提升。针对视觉单目标跟踪过程可能受到噪声干扰的情况,本文将生成对抗网络和全卷积孪生网络结合,提出对抗孪生网络。对抗孪生网络包括生成网络和判别网络两部分,其中生成网络模拟真实环境,通过施加不同类型噪声干扰判别网络跟踪目标。判别网络学习噪声分布,优化自身参数,克服噪声影响从而能够准确跟踪目标。整个网络通过交替训练不断提升生成网络和判别网络的性能,实验表明本文提出的跟踪器对复杂场景下目标的跟踪有了一定的提升作用。
其他文献
自改革开放以来,中国不断融入全球生产体系,深度参与全球价值链,成为“世界工厂”。资源型产业,作为支撑我国经济社会快速发展的基础性产业积极迅速嵌入全球价值链,通过嵌入全球价值链,我国的资源型产业在技术创新方面有了很大的提高,但是其在产业转型升级的过程中仍面临技术水平的制约。资源型产业在全球价值链分工中的仍处于价值链低端地位,如何有效提高资源型产业在价值链分工中的地位实现产业技术升级,是我国资源型产业
在计算机视觉中,目标检测是最为基础重要的任务。它是无人驾驶、无人监控系统、文字识别等诸多计算机视觉应用方向的基础。当前以卷积神经网络架构为基础的目标检测算法由于
语音信号作为信息最普通最直接的表达形式,是日常生活中非常重要的一部分。然而从外界直接获取的语音信号大多是不同语音信号的混合,从中无法直接获得有效的信息。因此,迫切
道路交通事故是威胁人类生命质量安全与日常工作生活的社会公共事件,中国道路交通事故发生率长期居高不下,事故严重程度较高,每年因交通事故死亡的人数众多,并且造成重大的经济损失。因此我们迫切需要对道路交通事故的分布规律、成因、预测与预防对策等问题进行深入研究,以降低事故发生率及严重程度。本论文重点关注天气情况、灯光情况、路面状况、道路类型、道路安全设施等静态客观因素与人类活动情况等主观因素对事故发生的影
人的价值问题是人在社会关系当中,对自己生命活动的审视和思考。马克思关于人的价值问题,是从人本身出发,从人的主体性、社会性、实践性等方面进行思考。马克思人的价值思想是马克思主义哲学的重要组成部分,探讨马克思人的价值思想的最终目的就是为了实现人的自由而全面的发展。本文旨在对马克思人的价值思想及当代意义作一探讨。首先,本文从历史发展的过程出发,追溯了人的价值产生的历史渊源,通过概括从古希腊时期、中世纪时
随着经济的发展与生活水平的提高,国民越来越重视自身健康,中药材产业也越来越受到国民关注。在互联网技术的推动下,中药材产业步入信息化建设阶段,许多企业开始构建中药材平
瓦斯爆炸作为煤矿灾害事故类型之一,是影响煤矿安全生产的重要阻力。随着人工智能、机器学习技术的发展,井下监控系统不断完善,但存在监测数据综合利用率不高、风险源演变趋势判识精准度较低等问题。如何有效识别瓦斯爆炸风险,及时对事故作出精准预测,是目前煤矿行业急需解决的问题。基于此,论文采用数据驱动研究模式,搜集较大及以上煤矿瓦斯爆炸事故调查报告相关数据,提取瓦斯爆炸事故致因关键词;结合文献研究、国家煤矿安
篮球运动比赛中充满了各种身体对抗,场上发生的情况瞬息万变,技战术的灵活运用更加巧妙,而且攻防转换速度非常快,这就对篮球裁判员的临场应变能力和判断能力是一个极大的考验
目标跟踪是计算机视觉领域研究重点之一,在自动驾驶、智能交通监控等诸多领域都有很大的实用价值。目前,最主流的跟踪算法是基于判别类的相关滤波跟踪算法,但在一些复杂的跟
铜冶炼污酸作为铜冶炼行业难处理的污染物之一,因其产量大,成分复杂成铜冶炼行业的“癌症”。本文针对铜冶炼污酸中砷的去除问题,基于铁砷化合物的化学沉淀和胶体的絮凝原理,提出采用三氧化二铁进行污酸处理的方法,此方法的关键是三氧化二铁在污酸中铁元素的释放,主要进行了以下三个方面的研究:三氧化二铁在污酸处理过程中时间、温度、酸度、液固比、搅拌速度对三氧化二铁浸出总铁的影响和除砷能力初探;响应面法优化实验浸出