基于深度融合学习的RGBT视觉目标跟踪

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:BBQChris
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉目标跟踪是计算机视觉领域的一项经典研究课题,在视频监控、自动驾驶和人机交互等方面应用广泛。尽管对于目标跟踪的研究取得了很大进展,但单模态信息的局限性和不确定性影响跟踪效果,如可见光成像受光照、雨、烟和霾等环境条件的影响较大,红外成像虽受环境影响小,但其成像机理导致红外图像分辨率较低、纹理少,在热交叉条件下目标与背景难区分等。基于可见光和热红外(RGB/Thermal,RGBT)的双模视觉跟踪器,可以综合利用两种模态内在的信息关联性和互补性,降低单模态信息的局限性和不确定性,提高视觉系统的鲁棒跟踪能力。传统的目标跟踪算法依赖于手工特征,所以算法的性能会受到限制。基于深度学习的目标跟踪算法利用深度神经网络来学习更加鲁棒的特征表示,具有较高的跟踪性能。本文基于深度学习目标跟踪算法,在决策级融合与特征级融合方法上对红外与可见光目标跟踪算法进行研究与改进,主要内容包括以下两个方面:提出一种基于不确定性估计的RGBT决策级融合跟踪算法。在不同场景下,红外与可见光图像的可靠程度不同,本文通过不确定性理论-主观逻辑理论对红外与可见光双模态的不确定性进行建模,作为对红外图像与可见光图像可靠性的度量,并据此确定双模态融合权重,进行跟踪的融合,从而提高跟踪结果的可靠性。算法首先生成目标候选框,通过网络获取每个候选框被判断为目标/非目标的证据,然后引入主观逻辑理论,通过Beta分布来模拟候选框类别概率的分布,并获取包含有双模态不确定性的二项意见,然后融合红外与可见光的意见以获得最终的跟踪目标,提高目标跟踪的性能。此外,本文基于融合证据与目标的运动信息,进行跟踪控制与网络更新,进一步提高跟踪鲁棒性。在RGBT基准数据集上进行实验,证明了所提RGBT跟踪方法的有效性。孪生网络跟踪算法在可见光跟踪任务中取得了较大的进展,具有较高的精度与速度,因而也被应用于RGBT目标跟踪任务中,现有的基于孪生网络的RGBT目标跟踪算法,多采用图像或特征拼接的方式融合双模态的信息,不能够充分挖掘可见光与红外图像的关联和互补信息,且容易造成特征冗余。本文通过自注意力机制,使红外与可见光模态关注到自身对于跟踪有用的信息,并通过跨模态注意力,充分提取红外与可见光关联与互补信息,获取高质量的融合特征。同时,由于孪生网络本身对于干扰物的判别能力较弱,在跟踪目标附近存在相似目标干扰时,容易跟踪失败,本文通过在线分类网络,在线学习目标特征,辅助孪生网络跟踪器,进一步提升跟踪性能。在RGBT跟踪数据集上的实验结果表明,所提的方法能够提升跟踪的准确度与鲁棒性。
其他文献
分布式数据库采用数据分片的方式,将数据分布在不同的服务器或者数据中心上,以获得分布式的存储和查询能力。Shared-Nothing架构是分布式数据库实现一种架构,集群中每个节点都有独立的硬件环境(Hardware Context),用户可以通过简单地增加节点以获得更高的存储容量和吞吐能力。分布式哈希连接(Dist-HJ)是分布式数据库中两表连接操作的一个重要实现,传统的Dist-HJ采用哈希重分布
学位
随着金融环境的不断变化,传统金融管理方式遭遇强烈竞争,在新的金融形势下,银行绩效考核体系之于银行发展的重要性与日俱增。合理运用绩效考核体系可以帮助公司挖掘问题,分配利益,达成预期目标,从而促进公司成长。合理的绩效考核体系是企业管理者与员工的纽带,科学地将两者联系起来,可以使得管理者与员工积极投入工作以提高客户满意度,从而提高公司整体效益。此外,公司客户经理在绩效考核体系中扮演着重要的角色,因此,对
学位
金融科技的发展促使了传统银行业在产品和客户服务、销售渠道、IT系统及数字化几个方面不断深入探索。到2020年,银行业已经有近30%的营收受到直接影响。因此,响应时代发展,寻求新的产品及营销策略成为商业银行促转型和谋发展的必由之路。进入应用阶段时无可避免地与一群天然生长在互联网和新兴事物下的群体发生联系,这就是本文中提到的年轻客户群体,简称年轻客群。移动支付尤其是手机支付的诞生与发展,使得这个群体对
学位
环状铁氧体是一种广泛应用于扬声器、拾音器、微波炉、电视等电子产品中的非金属磁性材料,其生产过程中会产生掉块、直裂、圈裂、杂质、粘膜、油污等缺陷,严重影响产品质量。目前主要通过人工观察进行质检,检测效率低、成本高。论文设计了一种基于机器视觉的环状铁氧体外观缺陷检测分拣系统,旨在减轻质检工人的劳动强度,提高质检效率,降低生产成本。根据环状铁氧体的滚动特性和磨床立式滚出工件的特点,论文设计了借助工件重力
学位
如今,立体匹配和图像压缩是计算机视觉中的关键研究问题,并且由于对自动驾驶汽车和场景理解的巨大需求而备受关注。跨光谱立体匹配是克服多光谱图像对之间的光谱间隙和估计视差图的一个非常具有挑战性的问题。此外,图像压缩是影响后续计算机视觉任务的基础研究领域,其主要目的是通过编码器将未压缩的图像压缩成比特流,以实现高效的存储和传输。在本论文中,我们研究了基于深度学习的跨光谱立体匹配和学习图像压缩。本文的主要工
学位
在室内自主定位领域,虽然目前已经有多种定位方式可供选择,但视觉SLAM因其成本低、可视化强、理论成熟等优势而备受欢迎,活跃在各种应用场合,极具潜力的移动机器人市场更是催生了各种令人惊羡的视觉SLAM算法。其中,ORB_SLAM2算法在基于特征点法的一类视觉SLAM算法中,具有里程碑意义。本文以ORB_SLAM2算法为理论基础,对室内自主定位方法进行探索和研究。首先,为了使视觉SLAM算法在图像发生
学位
传统机器人由于结构限制难以在狭窄非结构化环境执行预设任务,而连续体机器人相对于传统机器人其构型拥有无限冗余特性。无限冗余特性使得连续体机器人在拥塞的环境中有着极佳的柔顺适应性,其柔顺特性使其在狭窄拥塞的非结构化环境中彰显出广阔的应用前景。但无限冗余特性也给连续体机器人建模、跟踪控制带来了巨大挑战。本文以多段连续体机器人为研究对象,通过仿真与实验对其运动学和跟踪控制展开相关研究,主要工作如下:为了描
学位
近年来,数字化多媒体技术发展迅速,用户对数字化的图像和视频的需求量呈爆炸式增长。但是图像和视频的信息量相比于文本十分巨大,传输和存储需要大量的网络带宽和存储空间,因此需要对其进行数据压缩。目前,大多数的国际通用图像和视频压缩标准采用基于分块的DCT变化压缩编码技术。尽管这种技术可以提供相对接近原图的图像和视频,但其不可避免的会产生压缩伪影,包括块效应,带状效应和振铃效应。这些压缩伪影不仅影响用户的
学位
近年来,随着深度学习理论的兴起,计算机视觉的各个领域都得到了充分的发展。多目标跟踪技术作为计算机视觉中重要的组成部分,在这次深度学习浪潮中获得了长足的进步。由于多目标跟踪在军事、刑侦、商业分析等多个领域有重要的作用,因而对其研究有着重要的价值。相较传统方法,目前主流的基于深度学习的多目标跟踪算法已经有了显著的进步,但是人们对多目标跟踪算法提出了更高的要求,如实时高效跟踪、拥挤场景跟踪等。现有的跟踪
学位
随着电子信息技术的迅速发展,人们对光的认知不断地加深,不同波段光信息的获取变得尤为重要,通过光电传感器的数据采集与传输系统是获取光信息的重要手段。目前,大多数的数据采集系统可采集的通道数量有限且系统的功能也比较单一,难以根据光电传感器通道的数量进行灵活地扩展和系统升级。因此,本文根据多通道光电探测器阵列实际需求,研究探测器阵列、模拟信号调理模块、数据采集模块、信号处理模块与传输接口模块等结构及其相
学位