论文部分内容阅读
近年来,随着计算机视觉技术的不断发展,视觉目标跟踪技术也在迅速发展。目前,视觉目标跟踪已经是计算机视觉领域内的一项重要研究课题,也是当下的研究热点之一。尽管目标跟踪的研究在最近几年取得了很大的进展,但目标跟踪仍是一个具备挑战性的任务。在目标跟踪过程中,背景干扰、遮挡、目标的姿态变化以及环境光照的变化等因素都可能影响跟踪的结果。当前,目标跟踪广泛应用于视频自动化监控、交通监视、虚拟现实等多个领域,因此,对目标跟踪算法进行研究具有很重要的现实意义。经过近几年深度学习目标跟踪方法的发展,全卷积孪生网络目标跟踪算法SiamFC已经成为了一种比较经典的深度学习目标跟踪算法。它以孪生网络为基础,通过孪生网络把目标跟踪问题转换为对两张图像的相似性比较问题,以此来解决跟踪问题。本文以SiamFC算法为研究基础,首先对SiamFC算法进行了分析。分析包括定性分析和定量分析。分析结果发现,在背景复杂的情况下,SiamFC算法的跟踪结果准确性会降低。针对这一问题,本文在SiamFC算法的基础上引入了注意力机制,对输入图像经过卷积得到的特征进行通道和空间上的加权,同时调整了算法中CNN的主干网络模型,提出了一种结合注意力机制的孪生网络目标跟踪算法,它能加强特征提取的结果有效性,提升了网络模型对目标的判别能力。在本文算法中,注意力机制模块包括了通道注意力机制模块和空间注意力机制模块,通道注意力模块能让卷积神经网络对跟踪目标的外观语义变化具有更好的适应能力,而空间注意力模块能给特征图上不同的空间位置分配不同的权重,增加重要特征的空间位置权重使得特征更有效。利用本文算法进行目标跟踪实验,并将实验结果与SiamFC算法进行对比。结果表明,在背景复杂的情况下,SiamFC算法可能会跟踪到周围其它具有语义信息的物体上,而本文算法能专注于跟踪目标本身,跟踪效果更好。除此之外,本文算法在OTB2015、VOT2016和VOT2017数据集上也进行了目标跟踪测试,并与多个目标跟踪算法进行对比。实验结果表明,本文算法可以较好地解决目标跟踪中的背景复杂问题,且与其它算法相比,有一定的优越性。本文的主要贡献在于:(1)提出一种结合空间注意力和通道注意力的孪生网络目标跟踪方法,增加了孪生网络对目标的判别能力,改善了SiamFC在复杂背景下跟踪效果不佳的问题。(2)将孪生网络目标跟踪算法中的CNN主干网络模型从AlexNet替换为VGG,增加了网络的深度,提高了算法对目标特征的表达能力。(3)使用多个数据集对算法进行测试,并与多种方法进行对比实验,结果表明了本文方法具有一定的先进性。