基于深度学习的视觉目标跟踪算法研究

来源 :上海交通大学 | 被引量 : 2次 | 上传用户:s_ants
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉目标跟踪是计算机视觉领域的研究重点,其发展具有重要的意义,并且已经被广泛地应用到了各个领域,如航空宇航、国防建设、医药卫生等。尽管在过去几十年中跟踪算法研究取得了重大的进展,但由于跟踪场景复杂多变,实现高精度跟踪仍然是一个巨大的挑战。近年来,深度学习被引入到目标跟踪研究中并取得了突破性的进展。深度学习是模拟人脑学习和分析过程构建的多层神经网络,通过组合低层特征形成更加抽象的高层表示,这种分布式架构能够更好地学习到物体的本质特征。本论文采用具有强大特征提取能力的深度神经网络模型来实现对目标外观的描述,针对影响视觉目标跟踪的快速运动、背景噪声、旋转、光照变化等问题,从如何利用多层卷积特征来构建有效的外观模型的角度,提出了一些新的跟踪方法,主要研究思想和创新成果如下:(1)提出了一种基于空间上下文金字塔的目标跟踪方法。该方法开发了空间上下文信息以更好地学习目标和背景的关系,并设计了一个有效的空间窗,在保留目标信息的同时抑制了背景信息,增强了跟踪器的判别能力,同时,通过多级空间窗的联合使用构建了上下文金字塔外观模型,金字塔的每个层级都包含不同程度的上下文信息以适应不同的挑战因素。为了验证算法的有效性,分别采用了深度特征和传统特征与代表性方法相比较。实验结果表明,提出的算法对快速运动和背景噪声问题具有更好的跟踪精度。(2)提出了一种基于历史追溯的目标跟踪方法。该方法首先研究从不同卷积神经网络层提取的特征对视觉跟踪问题的影响,然后设计了历史追溯验证机制,这个机制通过双向定位目标并计算偏差来判断跟踪预测和更新模型的可信度。同时,这个偏差也作为卷积层选择的标准,在必要时,将会重新选择特征进行重新定位目标。大量的实验结果证明,提出的算法对背景噪声、快速运动、旋转、光照变化等问题具有更好的跟踪精度。(3)提出了一种基于交互式多模型的深度特征跟踪方法。该方法将相关滤波器应用到多个卷积层的输出上构造观测模型,并为每个观测模型学习一个对应的线上运动模型,这些观测模型和运动模型组成了多模型系统。然后将交互式多模型应用到视觉跟踪中以自适应地调整每个模型系统的权重,实现鲁棒的跟踪。为了验证提出方法的有效性,在两个公开的目标跟踪数据集上进行了实验和测评,结果表明,提出的算法对背景噪声、快速运动、旋转、光照变化等问题具有更好的跟踪精度。
其他文献
随着分子和细胞生物学技术的不断发展 ,基于树突状细胞 (DC)的肿瘤疫苗在恶性肿瘤的临床治疗中已获得越来越广泛的应用。DC是功能最强的专职抗原呈递细胞 (APC) ,具有独特的
以现有文献为基础,梳理了制造业转型升级的测度方法和测度指标以及相关研究,从质量效益、创新能力、信息技术和绿色发展四个方面,构建了制造业转型升级的综合评价指标体系以
语音学习是语言学习的基础,大学英语语音教学应是大学英语语言教学的重要组成部分。大学英语语音教学的重点主要有三个方面:语音石化的纠正,语流中的音变以及连续语流超音段
为探明不同种植模式下花生荚果产量及生理特性对钙肥的响应,在玉米‖花生3∶4间作与花生单作种植模式下,选用花育25为试验材料,分别设置4个施钙量处理(Ca0:0kg/hm^2,Ca1:150k
孔子"仁"的观念,是儒家伦理思想的核心。"孝悌"是仁之本,"忠恕"是仁之道,"泛爱众而亲仁"是仁之最高境界。同时,孔子的仁学思想具有突出政治功用,植根血缘,着眼伦理本位,既"乐
在检测实验室运作过程中,室内质量控制和室外质量控制均是非常重要的技术管理工作。本文详细地介绍了两者之间的区别和联系、特点和方法,指出了目前室间质量控制技术的不足,
近年来,涌现出一批采用全新的运行机制、用人机制、创新机制,开展科技创新与成果产业化的新型科研机构,它们在管理、人才、技术、科技成果产业化等方面取得了一定突破,对新一轮科
用瑞利散射光谱法研究了鱼血清蛋白在不同浓度有机弱酸水溶液中的变性情况,并结合液相色谱法讨论了鱼肉样品中主要基体蛋白质与鱼油对喹诺酮类药物(QNs)残留提取的影响。研究表
近年来大庆致密砂岩油层物性日臻变差,储层孔隙度仅在10-15%区间。面对孔渗低、储量丰度低、单井产能低的储层物性,进而提出施行压裂增产技术,加快致密砂岩油层勘探开发步伐
文章根据公路隧道对降噪吸音材料的特殊要求,以水泥、陶砂、膨胀珍珠岩等材料为主要原料,结合一系列的拌制工艺,研制出一种环保无污染、防火、防撞击、施工方便快捷、喷覆式