判别式视觉跟踪算法中深度特征表示与模型更新策略研究

来源 :长安大学 | 被引量 : 0次 | 上传用户:mxqfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉目标跟踪作为计算机视觉领域的重点研究方向,在视频监控、人机交互、智能交通、智能诊断、海洋探索、战场侦察等实际场景下得到了广泛应用。视觉跟踪的基本任务是,在给定视频的第一帧图像中,通过手工方式或者检测算法标注出目标的位置和大小,然后利用视觉跟踪算法预测目标在该视频后续每一帧中的位置和大小。视觉跟踪算法虽然经过了多年的发展,但仍然存在一些需要深入研究的问题:(1)目标表征能力弱。面对复杂多样的目标,需要选择合适的特征表示方法,才能对目标外观进行准确建模。一方面,针对不同的目标,往往具有不同的特点,应该选择不同的特征表示;另一方面,针对同一目标,如果在运动过程中外观不停地发生变化,也需要对其特征表示方法进行自适应调整。现有多数跟踪算法采用单一特征或者多个特征的简单融合,导致生成的目标特征对目标的表征能力较弱。(2)模型更新策略简单。视频中的目标外观一直处于变化中,甚至出现有些目标在相邻帧之间差异非常大的情形。为了适应这种变化,需要对跟踪算法观测模型进行更新。如果对模型每帧进行更新,不仅增加计算负担,当出现目标遮挡等情形时还会对模型造成污染,导致模型退化;如果长时间对模型不予更新,跟踪算法将无法适应目标外观的快速变化。现有的多数跟踪算法采用“不更新”或者“每帧更新”策略,不能满足鲁棒跟踪的需要。本文从目标深度特征表示和模型更新策略两方面对判别式视觉跟踪进行深入研究,主要工作总结如下:(1)提出了一种深度特征通道选择的方法,解决相关滤波框架下目标特征表示能力弱的问题。依据目标显著性区域与搜索区域的平均特征能量比对多通道特征进行裁剪,去除无效通道和干扰通道,同时提高了算法的跟踪准确度和跟踪速度。引入深层网络Res Net提取目标特征并进行特征融合,能够解决目标手工特征表达能力弱问题。利用深层网络Dense Net的特定层提取目标特征,发挥了更深层神经网络优点。利用通道选择对深度特征中存在的无效通道进行裁剪,提高了目标特征通道有效性,进一步增强了目标特征的表达能力。(2)提出了一种多特征博弈融合和高置信度模型更新的方法,解决相关滤波框架下目标多特征融合效果差和模型无法适时更新问题。利用多专家系统构造多个特征组合,并从中筛选出两个最重要的特征组合,再利用博弈论思想,对这两个特征组合进行博弈融合,能够提高多特征融合效果,得到鲁棒的融合特征;依据新提出的跟踪质量评估指标,设计了一种有效的模型适时更新策略。多互补特征博弈融合解决了手工特征或深度特征造成的特征单一问题,而利用专家系统构造多个特征组合并进行筛选,能够充分发挥HOG特征、CN特征和深度特征的优势,进一步提升了多特征融合效果,增强了融合特征的表达能力。(3)提出了一种轻量级空间注意力机制和连通域模板更新的方法,解决孪生网络(Siam FC)框架下主干网络目标表征能力弱和目标模板无法更新问题。在Siam FC基础上,将特征提取主干网络Alex Net替换为更深层次的VGG-19网络,并在模板分支主干网络后串接新设计的轻量级空间注意力模块LSAM,同时利用连通域模板更新策略,增强了主干网络特征提取能力的同时,实现了目标模板的选择性更新。将非局部注意力和通道注意力,以及全局上下文注意力和坐标注意力分别串联到主干网络尾部,能够实现模型对目标区域的重点关注,并提高模型对目标外观显著变化的适应性。使用双模板策略,解决了目标模板无法更新的问题。使用轻量级空间注意力模块LSAM和连通域模板更新策略,更好地解决了主干网络目标表征能力弱和目标模板无法更新问题。本文针对特征表示和模型更新两方面存在的问题,对判别式视觉跟踪算法展开研究,提高了跟踪算法性能。多个基准数据集上的实验结果表明,所提方法较好地解决了视频序列中存在的尺度变化、光照变化、目标遮挡、目标形变、背景干扰、低分辨率等具有挑战性的问题,实现了跟踪算法在复杂环境下的持续稳定跟踪,进一步促进了视觉跟踪算法在实际场景中的应用。
其他文献
现有地震响应分析方法在处理非线性随机地震响应时,都存在一定的缺陷,或不能处理随机地震作用,或不能求解非线性问题,或计算耗时太长。针对该问题,本文提出了一种基于深度学习的非线性随机地震响应预测方法,从梁桥几何信息的空间表达形式、人工地震波合成、桩-土作用等多个方面展开了深入研究,并基于BIM建模软件Revit开发了连续刚构桥的地震响应智能分析模块。本文在研究过程中虽然以连续刚构桥作为具体研究对象进行
学位
土壤水、盐含量信息是地学信息系统的重要组成部分,也是地球科学领域研究各圈层能量流动的关键参量之一。明确土壤水盐含量对气候、地质演变,生态系统平衡具有重大意义。同时,大面积实时获取耕地的土壤水、盐含量能够为生态环境治理,精准农业的实施提供指导。随着多源、高分辨率遥感的出现,使得快速、大面积的土壤水盐监测的可靠性大大提高,其中光学遥感与合成孔径雷达(SAR)影像结合的多源遥感能够在排除地表状态干扰的情
学位
榆林地区地处毛乌素沙漠南缘,拥有丰富的风积沙资源,应用水泥稳定技术,在路床和路面结构层方面前期已有丰硕的成果。同时榆林沙漠地区的降雨量相对于其它沙漠地区较多,每年集中在7~9月,易对路基边坡、排水沟渠等造成严重的水毁,影响路基的稳定性和道路安全。本论文针对路基水毁,应用水泥稳定技术,对风积沙地区路基边坡、排水沟渠的加固展开研究。本文针对榆林地区风积沙的A、B、C三种类型,分别进行了密度测试、击实试
学位
学位
针对交通运输行业对能源和环境产生的副作用,世界各国致力于发展新能源汽车,其中纯电动汽车凭借其“低噪音,无直接尾气排放”等特点成为新能源交通技术的主导发展方向。同时,为了缓解交通拥堵问题,各大城市纷纷推出共享电动汽车模式作为新型的交通出行方式,以缓解紧张的道路资源。然而,由于找车、停车带来的不便以及人工调度困难等问题,我国共享电动汽车发展缓慢。自动驾驶技术的出现有望解决这些问题,实现共享电动汽车自主
学位
模态参数是反应桥梁结构状态的固有特征参数,作为桥梁健康监测的重要内容之一,连续、自动获取桥梁运营状态下的长期模态参数是健康监测的核心需求。本文聚焦基于健康监测的桥梁运营模态参数识别与追踪中存在的自动化不足、适用性不广、鲁棒性不高等问题,以自动化为目标驱动,从运营模态自动识别和追踪两方面开展研究,理清识别和追踪全过程的核心问题,提出新方法和新指标解决传统识别方法中存在的系列问题,并通过工程应用验证提
学位
山区沿河路基受河道水流冲刷而导致水毁,引发交通中断的现象时有发生。论文依托陕南山区沿河公路工程,结合公路水毁主要类型及特征,以弯道凹岸冲刷和顺直河道挑流、压缩冲刷等水毁形式的河道水流流场特性为研究对象,利用野外现场调查、模型试验和数值模拟相结合的手段,采用河道水力及几何原型基本参数,从不同的水力条件、弯道几何形态、直道挑流角度、压缩占比、压缩长度等方面,系统研究流场特性变化规律。在此基础上,建立流
学位
本次研究通过使用hedonic价格模型法来量化城市公共绿地的价值。在变量的选取上,着重与景观生态学结合,构建住宅特征、区位特征以及绿地环境特征的指标体系,使指标的选择突破传统的空间指标局限。并以北京市朝阳区为例,分析影响公共绿地价值的空间与景观生态因素,提供一种研究思路,为今后城市公共绿地的合理规划提供一定的参考价值。最后取得的结果表明:公共绿地的在区域上的集聚等因素对于规划而言至关重要;在规划布
会议
甘肃厂坝-李家沟超大型铅锌矿床位于西秦岭多金属成矿带内的西成矿集区,有关其成因认识一直存在分歧。本文通过运用现代矿床学、地球化学理论和高精度的分析测试方法,对厂坝-李家沟铅锌矿床和矿区内的岩浆岩开展了系统的矿床地质、岩石学、同位素地球化学、流体包裹体、成岩成矿年代学等研究工作,并结合前人的研究进展,揭示成矿作用特征和成矿构造背景,阐明了矿床成因并建立成矿模型,取得以下主要研究成果与认识:(1)获得
学位
传统的农业用水及农药剂型利用效率低,稳定性差,对环境产生极大威胁。在缓/控释系统研究的基础上,响应控制释放体系可以智能响应外部环境刺激,触发释放活性成分,有望实现水和农药减施增效的目的,提高现代农业的生产率和可持续性。针对目前农业用水和农药高施低效以及农药流失引发的农业面源污染问题,本研究以天然生物大分子海藻酸钠(Sodium alginate,SA)和温敏材料聚(N-异丙基丙烯酰胺)(Poly(
学位