论文部分内容阅读
视频目标跟踪技术一直是计算机视觉领域的研究热点和难点问题,尤其是对数目未知且时变的视频多目标跟踪。在军事安全、国防建设和民用领域都具有重要的研究意义。近年来,深度学习在目标视频跟踪中已得到广泛应用,基于神经网络的深度特征及采用相关特征的检测技术使视频目标跟踪技术取得了突破性进展。本文围绕多伯努利滤波在视频多目标跟踪过程中的应用,结合深度学习展开深入、系统的研究,取得的主要成果如下:1、针对视频多目标跟踪中,目标数目未知且时变的复杂场景下,目标建模复杂,存在目标之间或背景等相互干扰的问题,提出一种基于卷积特征的多伯努利(Multi-target Multi-Bernoulli,MeMBer)视频多目标跟踪算法。特征提取方面,算法中通过k-means聚类方法训练卷积核,并与目标卷积以提取目标特征;为减小复杂背景的干扰,同样对背景进行采样,提取目标的背景特征,并将目标特征与背景特征融合以提取目标的卷积特征,可以实现对目标进行精确表示。跟踪滤波方面,算法中通过目标卷积特征建立目标似然模型,并融入到多伯努利滤波框架中完成对数目变化的视频多目标跟踪;为了避免目标紧邻运动和遮挡造成模板不准确的问题,根据目标状态变化速度和目标被遮挡程度,进一步提出模板自适应更新策略,以提高跟踪的精度。最后,采用标准数据库中的红外和彩色视频数据,对提出的算法进行验证,结果表明,提出算法与传统的多伯努利滤波算法相比,能够较好地适应目标状态变化,有效解决复杂环境下的目标紧邻和遮挡问题,且具有较好的跟踪精度。2、针对视频多目标跟踪中新生目标时间和位置不确定,导致多目标视频跟踪状态估计存在较大误差、甚至出现目标漏跟的问题,本文引入基于深度学习的检测算法,提出基于单发多框检测的(Single Shot MultiBox Detector,SSD)多伯努利视频多目标检测与跟踪算法。算法中通过SSD对视频中目标进行初步检测,并将新生目标采用随机有限集进行建模,融合多伯努利滤波框架实现对未知数目视频多目标的准确跟踪;该算法可以解决检测算法中存在的漏检、误检等问题,且避免多伯努利贝叶斯滤波连续递归后存在目标估计偏移问题,可有效提高跟踪的精度。最后,采用标准数据集中的视频数据进行实验,结果表明,提出的改进算法能够有效处理复杂环境下的多目标新生问题,且通过检测结果和跟踪结果融合滤波,有效提高了算法对视频多目标的跟踪精度。3、针对传统多伯努利滤波算法不能对目标的航迹进行跟踪,存在滤波过程中紧邻目标难以区分的问题,本文引入广义标签多伯努利(Generalized Labeled Multi-Bernoulli,GLMB)滤波框架,提出基于GLMB的视频多目标跟踪算法。算法中将标签概念引入到随机有限集理论中,对多伯努利分量进行标记,并采用δ-GLMB滤波框架进行递推,以实现对视频多目标的跟踪,采用标签和目标状态共轭的关系,可以识别各个目标的航迹。实验结果表明,该算法能够获得每个目标的航迹,并一定程度上可以提高算法对视频多目标的跟踪精度。