【摘 要】
:
目标跟踪是计算机视觉的重要研究课题之一,广泛应用于智能视频监控、自动驾驶、智能交通、航空航天、虚拟现实等领域。近些年,目标跟踪领域飞速发展,其中基于相关滤波的目标跟踪方法引人注目。目前,基于相关滤波的目标跟踪方法经过几年的研究与发展,已经进入瓶颈期,仅仅凭借相关滤波似乎已经无法取得更好的效果。本文以相关滤波目标判别模块为基础,结合基于卡尔曼滤波的位置修正模块和基于交并比网络的边界框优化模块,提出了
论文部分内容阅读
目标跟踪是计算机视觉的重要研究课题之一,广泛应用于智能视频监控、自动驾驶、智能交通、航空航天、虚拟现实等领域。近些年,目标跟踪领域飞速发展,其中基于相关滤波的目标跟踪方法引人注目。目前,基于相关滤波的目标跟踪方法经过几年的研究与发展,已经进入瓶颈期,仅仅凭借相关滤波似乎已经无法取得更好的效果。本文以相关滤波目标判别模块为基础,结合基于卡尔曼滤波的位置修正模块和基于交并比网络的边界框优化模块,提出了运用多种信息的单目标视觉跟踪算法。主要创新工作包括:(1)在现有相关滤波算法的基础上,对目标判别模块做了优化,提升了目标判别能力。改进了训练集样本纳入方案,得到了更具代表性、更精简的样本集;调整滤波器模板的更新频率,在减少运算量、降低过拟合的同时获得了更鲁棒的滤波器模板。(2)提出了基于卡尔曼滤波的位置修正方法,使用目标的运动信息对目标判别模块得到的目标位置进行修正,得到最优的目标位置输出。(3)设计了基于交并比网络的边界框优化模块,运用物体边界框的通用表达信息,对候选边界框进行非极大值抑制和边界框梯度上升优化,得到更精准的目标边界框,有效提升了目标跟踪的准确性。本文算法在多个目标跟踪数据集上进行了测试,结果表明其性能优于现有的多个基于相关滤波的目标跟踪方法。算法在OTB-2015数据集上的AUC得分为69.8,超过了经典的相关滤波类算法ECO和近期提出的孪生网络算法Siam RPN++。与VOT2018比赛前10名的算法相比,本文算法具有最佳的准确率(Accuracy)和预期平均重叠(EAO)得分。算法在UAV123数据集上的AUC达到64.8,比UPDT提高19%,比ECO提高23.4%。在Tracking Net数据集上的各项指标均大幅超过UPDT,AUC得分超出17%,归一化精确度超出10.3%。在NFS数据集上的AUC得分为61.3,大幅超过基于相关滤波的算法C-COT25.6%,超过UPDT算法14%。
其他文献
切换系统是混杂系统中的一种典型代表,切换系统由一系列被微分方程和差分方程描述的子系统和一个决定这些子系统切换的切换信号组成。实际物理系统很多具有这种切换特性,这就赋予了切换系统丰富的应用背景,切换系统的研究也备受关注。随着网络技术的发展,控制系统的规模越来越大、控制精度要求越来越高,鉴于传统周期采样控制在信息冗余方面的劣势,一种新的基于事件的控制方式受到广泛关注。动态事件触发作为事件触发控制的一种
面部表情是人类智力的一个非常重要的方面。其中,通过面部表情表达人类情感是最有说服力的证明。近年来,深度学习成为一种趋势,特别是卷积神经网络,由于在人机交互领域的大量应用,在近十年来得到了广泛的研究。在相同条件下或至少相似条件下,研究人员已经能够从在实验室中拍摄的图像中获得良好的结果。然而,在任意的面部图片与各种头部姿势和不同照明条件下,这些模型并不是很好。野生表情是指在真实环境中捕获的,自然的表情
在线教育的蓬勃发展为人们提供了一种新的学习方式,各大在线学习平台的崛起为人们提供了方便的学习途径。在传统模式下,园林植物的教学存在需要改进的地方,同时由于专业和学科的特殊性,园林植物的在线学习本身具有独特性。通过对相关文献的研究,得出目前园林植物学习存在种类繁多、记忆不清、图文描述比较抽象、空间感尺度感不足的问题。本研究探讨通过搭建园林植物学习平台解决这些存在的问题。利用问卷调查的形式,分析了植物
计算机断层成像技术(Computed Tomography,CT)可以在未经手术的情况下获取病人体内密度信息,是临床图像诊断的重要手段之一。病人体内如果有金属植入物,则会在CT图像中产生金属伪影,此金属伪影会严重干扰临床诊断结果,并影响放射治疗计划中剂量计算的准确性。目前来说,去除金属伪影的传统方法主要集中在对投影数据的处理上,而不能应用于重建后的CT图像,不便于医院、普通研究者等无法获取投影数据
金属3D打印技术(也称增材制造),相对于传统的减材制造技术,其制作过程更简单,能够生产出结构更为复杂的工件,越来越受到各个领域的重视。然而,3D打印技术还处于高速发展时期,技术尚未完全成熟,因此打印工件内部存在不同类型的缺陷。孔隙缺陷很大程度上会影响工件性能和工件使用寿命。检测出工件中孔隙缺陷的位置、形态、数目,可以为缺陷形成的技术机理研究提供分析基础。CT技术能够在不破坏工件的情况下,重建出工件
近年来,与日俱增的移动相机如无人机搭载相机、可穿戴相机等,能够以灵活的视角对场景中目标进行观测。无人机搭载相机的垂直俯视视角能够以广阔的观察视野对目标进行观测,可穿戴相机的平视视角能够以沉浸式的视角对目标进行观测,二者互补能够对场景中目标进行灵活有效的全方位观测。跨大视角的多相机协同技术,使得基于俯视和平视视角结合的视频监控技术在目标跟踪、行人再识别、行人动作检测和行为分析等领域有着重要的研究意义
《大秦驭手》是一款马车驾驭虚拟体验系统,旨在为博物馆和个人用户提供秦代马车的趣味驾驭体验,展现了秦代的历史背景和风貌。为了提升用户体验效果和沉浸感,展现更好的游戏场景,对图形效果提出了更高的要求。本文通过为《大秦驭手》虚拟体验系统设计游戏特效开展了系统的实践研究,设计并开发完成多种特效系统:云雾特效系统、材质特效系统、镜头特效系统以及物理特效系统。并使各个系统有机结合。在塑造了鲜明的游戏视效风格的
作为智能交通系统的重要组成部分,车载自组织网(Vehicular Ad hoc Networks,VANETs)的发展一直受到国内外各界的关注。然而由于无线访问介质的开放性和车载自组织网自身的特性,其非常容易受到外界的各种攻击,这严重影响了车载自组织网的广泛部署与应用。为了确保道路交通的安全并保护用户的隐私,在车载自组织网中提供有效的匿名身份认证成为当今研究的热点。当前的认证方案大部分采用传统的假
在互联网技术迅猛发展的背景下,用户画像技术被广泛应用于各个领域,其核心是通过对用户各类行为进行分析,从而将用户特征抽象为标签形式。本文以真实校园网络行为日志为基础,对校园网络用户画像进行了深入研究。针对校园网络行为日志对学生行为类别表述模糊的特点,本文提出了融合压缩DOM树结构向量的行为类别标签预测模型,通过融合网页文本特征向量和DOM树结构向量并使用分类器进行分类,实现了对学生浏览网页的类别预测
近年来,随着计算机技术的发展,隐蔽通信已经成为一个比较活跃的话题。在本研究中,我们通过利用数字音频水印技术来实现隐蔽通信。数字水印是一种有效的军事领域秘密通信的技术,可以解决传统加密中存在的问题。它是将具有特定含义的信息嵌入到原始信号中而不影响其正常使用的过程。在传输时只需要传输嵌入水印的信号即可。由于信号在传输过程中,可能会遭遇不同程度的有意或者无意的攻击,因此在嵌入水印时,水印算法需要满足一定