基于孪生网络结构的卷积跟踪模型

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:zy34970348
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为计算机视觉的一项基本任务,目标跟踪是热门的研究领域之一。其中,可见光目标跟踪在自动驾驶、增强现实和自主机器人等方面有着重要的应用价值,而热红外目标跟踪由于不受光照的影响,可以用于实现夜间监视、夜间辅助驾驶等。在目前的跟踪领域中,孪生系列跟踪网络可以有效地平衡精度和速度,但是在面对复杂多变的跟踪场景时仍然有较大的局限。首先,现有的孪生跟踪器大多只考虑第一帧的特征,难以从帧间信息中获益。当遇到遮挡或快速运动等挑战时,最新运动信息的缺乏会导致跟踪器性能的降低。其次,红外图像中只存在亮度分量信息,缺少色彩信息,易受相似目标和杂乱背景的干扰。针对以上问题,本文围绕孪生网络在目标跟踪中的应用,对可见光目标跟踪和热红外目标跟踪进行了算法优化研究,主要贡献点如下:(1)提出了基于时空卷积和孪生网络的实时目标跟踪算法。本文探索了最新的连续帧中丰富的信息对初始模板帧的特征表示的改进。具体来说,本文使用经过时空卷积后的最新多帧的特征生成注意力图,然后将该注意图和第一帧的特征进行相乘以获得更新后的模板。利用注意力图,模板可以自适应地应对目标的遮挡和变形等。模型中所有帧的空间卷积是共享的,因此特征结果可以复用,新增的更新模块几乎不增加跟踪耗时。该模块可以嵌入到不同的孪生追踪器中。(2)提出了基于频域变换和特征选择的红外目标跟踪算法。为了加快红外跟踪速度,本文对红外图像亮度通道进行了离散余弦变换,然后在频域中进行特征提取。通过减少部分卷积层和池化层,频域深度学习可以在不降低模型性能的情况下有效提高模型的跟踪速度。同时本文引入模板帧对搜索帧的特征加权系数,突出目标,抑制背景。此外,针对红外模型训练集规模较小的问题,提出了一种基于灰度化的便捷易用的数据扩增方案用于模型预训练,有效地提升了模型的训练效果。本文在可见光跟踪和热红外跟踪对应的权威数据集上进行了大量的模块有效性分析、属性分析、定性分析等实验,验证了本文提出的跟踪算法的有效性。在保证实时性的同时,本文提出的两个改进算法对比基线算法在性能上都有所提高。
其他文献
随着汽车保有量大幅提高,交通事故越来越频发,严重威胁人民财产和生命安全。绝大部分交通事故由异常驾驶行为导致。为了减少交通事故发生,安全辅助驾驶系统研究具有重大应该
叶面积指数(Leaf Area Index,LAI)是评价植物生长发育和健康状况的重要指标。快速、准确地获取植被叶面积指数是评估荒漠化区域植被生长状况和固碳能力的重要前提。荒漠化区
随着互联网的快速发展,无纸化、信息化办公逐渐成为主流,各行业对软件系统的开发需求非常旺盛,使得软件开发行业快速发展。但在业务快速增长和变化的过程中,应用开发领域产生
教育部最新版的《大学英语教学指南》(征求意见稿)中把专门用途英语作为大学英语教学的三大主要内容之一,首次针对其内涵、特点、级别、教学安排进行说明。专门用途英语课程
同伴反馈是一项重要的学习活动,学习者以小组为单位合作对彼此的作文反馈、提出改进建议。该方法是形成性评估方法中的一项分支,应用于外语教学,尤其是在高等教育范围。前人
如今,随着汽车的普及,其成为人们日常生活工作中一部分,同时也带来了严重环境问题,电动汽车应运而生。其将逐渐成为汽车产业的主导力量,并成为社会发展过程中不可或缺的力量
平移变换是一种在卷积神经网络训练过程当中广泛使用的数据增强方法。本文用数学方法分析了平移变换的物理含义,发现了平移变换的方法会使卷积神经网络在训练过程当中关注于训练图片中心区域的特征,从而使得卷积神经网络的感受野变得不均匀。如果用厚度表示感受野各区域被关注的程度,则平移变换使卷积神经网络在训练过程当中的感受野呈现出中间高、四周低的“金字塔”型分布。人类的视网膜的感受野各区域的分辨率是不相同的:中心
自越南革新开放以来,经济、社会、文化、科技等领域快速变革,新的事物、现象、概念层出不穷,越语词汇不断发展以满足新的交际和表达需求。占据着越语词汇系统“半壁江山”的汉越词亦不例外,它也紧跟着时代的步伐,不断地丰富与完善。对革新开放时期的汉越词进行研究,能够帮助我们更好的把握越语词汇发展的新趋势,从中透视出越南社会文化的发展面貌。本论文将研究范围限定为越南革新开放时期新出现的汉越词(包括固有汉越词衍生
点击率(Click-Through Rate,CTR)预估是计算广告和推荐系统中一个重要且极具商业价值的问题。在这一问题中,数据大多数是以多类别结构化的形式存在。在经过One-Hot编码之后,
随着科学技术的飞速发展,固态盘(Solid State Drive,SSD)在大规模存储系统中得到了广泛的应用。然而SSD的寿命有限,擦除次数达到一定时,性能会下降,数据可靠性会降低。现有的静态数据布局方法没有考虑到SSD设备之间的磨损差异;而现有的动态数据布局方法使用数据迁移来均衡集群的磨损,会给SSD带来额外的写入开销。针对现有的应用于SSD存储集群的数据布局方法所存在的问题,提出了两种数据布