基于孪生网络的目标跟踪算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:F8251256
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪是计算机视觉领域最热门且最具挑战性的研究内容之一,在自动驾驶、视频监控等领域有着广泛的应用。近年来,基于深度学习的目标跟踪方法因其对深度架构的使用,更具表现力的深度特征等特点在目标跟踪领域引起了广泛的关注和研究。其中孪生区域候选网络SiamRPN从目标检测领域获取灵感,将孪生网络和区域候选网络相结合,在保证实时的同时,取得了较高的准确性。然而SiamRPN使用AlexNet作为骨干网络,受AlexNet层数较浅的制约,SiamRPN所提取到的深度特征判别力不足,没有有效地利用语义信息。针对这个问题,提出了将注意力机制和SiamRPN相结合的SiamRPN-CA跟踪算法,在保证实时性的同时,提高提取到的深度特征的判别力,有效地利用语义信息。并在多个数据集中性能良好,相比原SiamRPN性能有明显提升。此外,对SiamRPN-CA做出了进一步改进,使其能够进行长程跟踪,并通过长程跟踪数据集验证了改进的有效性。主要工作如下:
  1.根据国内外当前对孪生网络在目标跟踪领域的研究现状,对孪生区域候选网络SiamRPN现有的问题进行了研究分析,并基于分析结果,提出了一种短程跟踪算法SiamRPN-CA,在SiamRPN的基础上,引入注意力机制,增强了SiamRPN的特征提取能力,获取更具判别力的深度特征,并优化了SiamRPN的训练方法。最终在OTB50、OTB100、VOT2016数据集上性能排行前列,且相比SiamRPN有明显提升;
  2.针对SiamRPN-CA在长程跟踪方面的不足,提出了改进方案,使得模型在目标被遮挡或超出视野之后又重新出现时,能够继续保持对目标的跟踪。并在VOT2018LT长程跟踪数据集上性能排行前列,相比改进前召回率提高了21.66%,改进效果十分明显,具有一定的研究价值。
其他文献
图像拼接的任务是将多个具有一定重叠部分的图片拼接成一个无缝的大视景图像。目前图像拼接技术被广泛地用于生成全景照片、医学图像、虚拟现实等各个领域。现代的图像拼接算法通常基于特征匹配技术,依据图像中的特征匹配来估计图像的变换矩阵进行图像配准,再通过一定的方法融合配准后的图像得到拼接结果。  传统的图像拼接通常要求输入图像没有或只有很小的视差,具有较大视差的场景下的图像拼接问题是图像拼接领域的一个难点,
学位
从自然场景图像中读取文本由于其广泛的应用而受到了计算机视觉领域、模式识别领域以及工业界的广泛关注。在如今的智能大数据时代,能够有效地对图像文本内容进行提取分析并信息智能化对于学术界的理论研究和工业界的技术驱动都具有深远意义,而图像文本检测是后续文本内容识别的先决条件,但由于场景图像因光照、拍摄角度、背景和文本多样性等诸多问题,目前还鲜有能适用于复杂场景图像文本检测的技术手段,因此,提高对复杂场景文
人脸三维建模是一项发展已久的计算机技术,目前已广泛用于医疗、游戏和影视娱乐等领域。传统获得三维人脸的方法成本较高、过程复杂,在一定程度上限制了三维人脸的应用场景。而随着计算机视觉技术的进一步发展,从二维图像中进行三维人脸重建的技术逐渐成型,该方法前置条件简单,容易实现全自动化。但该方法重建的三维模型目前还存在几何形状不够精确、纹理贴图效果易受光照影响等问题,尚有较大的提升空间。  对三维人脸重建过
学位
前列腺癌是一种发生于男性前列腺的恶性肿瘤。临床上主要使用磁共振(MR)成像来对前列腺癌进行诊断。传统的人工阅片方法耗时长,且易受主观因素影响。计算机辅助诊断系统可有效提高医生诊断的效率和准确率。但是由于前列腺癌病灶具有体积小、轮廓模糊等特点,使用MR图像进行前列腺癌自动检测非常具有挑战性。  建立可用于深度学习的前列腺癌数据集非常困难,因此数据集中的训练样本较少。为了充分利用有限的数据,本文设计了
学位
在临床诊断过程中,提取脑部中矢状面具有非常重要的意义,通过中矢状面计算头部偏角,从而摆正图像中头部的位置,可以为诊断脑部疾病提供最佳观察视角;根据中矢状面计算大脑左右半球的对称性,也能为判断某些脑部疾病的提供重要参考依据。但是,现有的中矢状面提取算法通常存在提取效果不佳、计算成本大和鲁棒性差等问题。  因此,本课题提出了一种基于深度学习的中矢状面提取方案,方案分为三个步骤:(1)使用图像分割网络识
学位
近几年,基于图结构的卷积神经网络技术的发展使得知识图谱中的节点信息能够通过训练得到更富有语义的表示,与此同时,一些工作表明了知识图谱能够通过增强推荐数据集中的项目实体而对推荐算法起到一定的优化作用。为此,以基于知识图谱图卷积神经网络的推荐算法为主要研究目标,开展图谱数据完善、卷积计算、基于图谱的推荐方法的研究。  研究利用知识图谱广泛的结构信息对用户、项目交互数据进行补充,在整合了知识图谱中项目属
学位
乳腺癌是女性中最常见的癌症之一,早期的筛查以及诊断非常有意义。乳腺肿块是早期乳腺癌的主要表征之一,当前乳腺癌筛查最有效的手段是乳腺钼靶X线摄影检查。研究乳腺肿块分割算法,通过准确分割乳腺肿块,辅助医生判断乳腺肿块的良恶性,有助于提高患者的生存几率,具有重要的临床意义。  乳腺肿块通常具有形态大小多样且边缘不规则的特点。针对乳腺肿块形态大小多样的问题,设计并实现了基于U-Net模型的MU-Net模型
随着计算机技术和医学影像技术的发展,计算机辅助诊断治疗可以减轻医生的工作量和辅助医生诊断。人体肋骨包含了完整的腹部与胸部,具有相对稳定的形状,肋骨分割在医学上用途很广,可以检测骨头是否有骨折等异常,分段肋骨也可以作为参考物体,帮助定位其他结构,比如肝脏,心脏等,还可以为一些量化任务提供参考,比如肺体积的估计。  肋骨与肩胛骨、脊柱以及胸骨粘连较近且灰度值相似,传统的分割方法不能很好地处理骨头连接处
学位
尽管深度神经网络目前在许多方面展示出强大的能力,但由于其高能耗的特性,无法应用在一些计算资源有限的场景下。而脉冲神经网络作为第三代神经网络,是目前最拟合生物神经元机制的模型。相比深度神经网络,在脉冲神经网络所需的计算量和能耗远小得多。  目前,脉冲神经网络在图像识别和目标检测方面达到了较好的效果,但对于更复杂的计算机视觉任务相关研究却很少。作为计算机视觉领域最重要的任务之一,目标跟踪有较高的实时性
学位
目标检测技术是计算机视觉领域内的研究热点之一,其成果被广泛应用于智慧安防、自动驾驶等领域。随着深度学习技术的发展,目标检测技术取得了突破性的发展,但对于小目标和低清目标的检测精度仍有待改进,这使得目标检测技术在实际应用中依然有很大局限,所以如何设计能够准确检测小目标和低清目标的算法对于推广目标检测技术的应用有重大意义。  立足于目标检测技术对于小目标和低清目标检测不够准确的问题,通过研究突破相关技
学位