基于孪生网络的视觉跟踪算法的研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:chengkemin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉跟踪是计算机视觉领域的一个重要研究方向,现在已经广泛用于军事、医疗、机器人、智能交通等领域。近年来,深度学习技术获得了极大的突破,深度神经网络强大的学习能力为视觉跟踪提供了一种新的研究思路,使得跟踪器具有更高的准确率。研究基于深度学习的视觉跟踪算法具有重要的理论价值和现实意义。基于深度学习的跟踪器取得了巨大的成功,极大的提高了跟踪器的性能。但是由于深度神经网络涉及到复杂且庞大的计算,跟踪器的实时性很难得到保证。本文基于孪生网络Siam-FC研究视觉跟踪算法,Siam-FC由两个完全相同的子网络分支组成,其结构简单、性能突出,具有实时跟踪的潜能。然而Siam-FC算法无法处理目标模板中存在噪音情况。具体而言,在噪音环境下,将目标模板的特征图与搜索区域特征图进行全卷积操作时,得到的响应图中可能存在多个极大值,使得跟踪器极度不稳定。本文通过设计两种新颖的网络架构,强化目标区域的响应,抑制噪声区域的响应,从而提高视觉跟踪算法在复杂视觉场景下的跟踪性能:1、跨层对比孪生网络(Siamese of Cross Layer Contrastive Loss,Siam-CC)。Siam-CC网络探索不同深度网络层的特征性质,对不同层特征与特定层特征进行全卷积操作,从而采用最合适的目标区域的特征去探索不同深度的搜索区域的特征。为了利用搜索区域更深层的特征,Siam-CC设计了非对称的孪生网络架构,在搜索区域的分支的尾部加入新的网络层。另外,为增强对有效候选框和无效候选框的判别,Siam-CC提出了自适应对比损失函数。实验结果表明,与原始的Siam-FC相比,Siam-CC在benchmark上的跟踪结果得到了较大提升。2、多域残差孪生网络(Multi-Domain Residual Siamese Network,MDR-Siam)。MDR-Siam网络利用残差块过滤响应图中的干扰响应点,并通过组归一化方法改进残差块的结构,使过滤效果更适合视觉跟踪任务。在此基础上MDR-Siam利用多域的方法将残差块设计为多个独立的域,使得特定的域仅负责处理特定的视频。同时,目标模板将不同背景噪声进行自适应的过滤预处理,根据模板中目标的长宽比例自适应地弱化目标模板的背景噪声,减小匹配过程中的干扰。在OTB-50的实验结果表明MDR-Siam比Siam-FC在跟踪精确度上有了一定的提升。
其他文献
近年来,静电纺丝纤维被广泛地应用于生物医学领域,比如:药物缓释控释载体、组织工程支架以及创伤辅料等。静电纺丝技术依靠电场力的牵引制备纤维丝,同时溶剂迅速挥发,药物被
传统电子产品以刚性器件为主,具有优异工作性能的同时也存在着局限性,无法适应不平整的工作平面。近年来,可弯曲柔性电子的出现为电子学提供了新的发展方向。作为穿戴式设备
人造的交叉反应受体阵列通过模仿哺乳动物的味觉和嗅觉被用于各种传感应用中。这些阵列通过模式识别算法用于区分分析物,甚至用于预测未知分析物的身份。然而,以往已经开发用
近年来,由于光子晶体微腔结构具有Q值高、有效模式体积小、易于集成、制作工艺简单等优势,使得其在纳米传感结构设计方面得到了广泛的应用,科研人员尝试在光子晶体微腔中通过
大庆油田自开发以来,油田道路作为一个配套工程,始终伴随着油田产能建设系统工程的推进而稳步发展,大庆油田道路系统经过多年建设,不断完善配套,道路布局比较合理。但是,大庆
铸造工艺设计的成功与否影响着铸件的成品率、质量、生产成本等各个方面。传统的铸造工艺设计方案的确定大多依赖于生产实践经验,比较难以精确计算。检测工艺设计的成功与否
研究背景CD99 antigen-like 2(CD99L2)是一种高度糖基化的Ⅰ型跨膜蛋白,不属于任何已知的蛋白家族。CD99L2蛋白分布广泛,在人和小鼠多种器官都有高表达。血液血管系统主要表
自磨机是一种应用于矿石中碎阶段的大型磨矿设备。由于其矿石处理能力强,工艺流程简单等特点,大量的大型选矿厂将自磨机投入到生产中。近年来自磨机技术发展迅猛,其大型化的
现代工业社会的发展对石油的需求量越来越大。石油作为地球上的一种不可或缺资源,其开采效率得到人们越来越广泛的关注。在石油勘探过程中,岩心取样作为一种获得地下岩层的物
智能交通系统作为一种先进的交通管理技术,越来越受到人们的重视,同时随着计算机硬件水平的提升,许多复杂算法所带来的实时计算困难的问题已逐渐突破。本文所研究的车辆检测