论文部分内容阅读
目标跟踪是计算机视觉的重要发展方向之一,在无人驾驶、智慧交通、智能监控以及军事侦察等方面有着很大的应用价值。近年来目标跟踪技术有了很大的进展,但在实际生活场景中由于环境的复杂性和其他因素的干扰,目标跟踪技术仍然面临不小的挑战。本文在孪生网络框架的基础上,针对目标跟踪过程中存在背景杂波、目标形变以及目标尺度变化等问题展开了深入的研究与探索。本文的主要工作内容和成果如下:(1)研究了一种基于全局上下文的密集孪生网络跟踪算法。为了提高网络的特征提取能力,增强网络对相似目标背景的判别,在对密集卷积网络可行性分析的基础上,将浅层的Alex Net网络更换成更强大的密集卷积网络。密集卷积网络中的卷积层以一种密集连接的方式进行连接,将层与层之间的特征在通道上进行拼接实现特征重用,提高特征的泛化能力。为了实现网络对目标外观变化的鲁棒性,在孪生网络模板分支后添加全局上下文模块将目标的全局上下文信息聚合,使网络能够输出语义信息更丰富的特征图。(2)研究了一种基于时空注意力机制的双模板密集孪生网络跟踪算法。当目标发生形变时,孪生网络中单一固定的模板不足以表达目标当前状态。针对这一问题,本文设计了一个新的模板与原始模板进行特征互补,实现目标模板的动态更新。新模板是根据历史预测结果得分图的平均峰相关能量值进行选定,选定后将原始模板与新模板都输入到孪生网络中分别得到各自特征图,然后将这两个特征图通过一个时空注意力模块得到各自权重图,将权重图与对应的特征图进行加权融合就得到融合后的模板特征图,再与当前帧经过密集网络得到的当前帧特征图进行互相关操作就得到最终响应图,从而可以确定目标位置。这种实时更新目标模板的算法能在目标畸变时也能发挥很好的目标跟踪效果。(3)研究了一种基于无锚框分类回归的密集孪生网络跟踪算法。为了应对目标跟踪中的目标尺度变化的挑战,将一个目标跟踪任务分解为分类任务以及回归任务。分类任务将目标与背景分开得到目标的粗略位置,回归任务预测目标状态得到目标边界框,两者结合就得到了目标最终大小与位置。网络是逐像素进行分类并预测目标框的,抛弃了以往依靠锚框进行分类回归的方式,避免了锚框超参数设置带来的不确定性以及高计算量。为了解决网络中质量评估分支与分类分支在训练和测试时存在的不一致性,将分类分支与质量评估分支融合到了一起,重新定义了训练标签的含义,设置了新的损失函数,既处理了目标尺度问题,又实现了不错的跟踪效果。本文算法在OTB2015数据集上进行了测试。测试结果表明,基于全局上下文的密集孪生网络跟踪算法在背景复杂多变的情况下仍然取得了很好的跟踪效果。基于时空注意力机制的双模板密集孪生网络跟踪算法在目标发生巨大形变时,目标跟踪的精确性以及鲁棒性依然很高。基于无锚框分类回归的密集孪生网络跟踪算法可以有效估计目标位置及边界框大小,在目标尺度发生变化时依然准确度很高。