基于时空匹配的视频目标分割算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:wuweiguowwg32691819
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频目标分割是计算机视觉的视频任务中极具挑战性的任务之一,在诸如监控、自动驾驶、视频编辑、自动化标注、视频理解等场景都有应用。所谓视频目标分割,即给定一个包含多帧的视频数据以及第一帧的目标掩码,要求分割出这个目标在后续帧的像素级别位置,可以看做是像素级别的目标跟踪。不同于基于目标框的跟踪形式,视频目标分割能更具体的表达出感兴趣目标的形态以及更加准确的位置。给人以更直观的信息,并且作为密集型预测任务,视频目标分割任务的难度更大,因此极具研究价值。该任务目前仍有许多挑战:(1)感兴趣目标在整个时序中,其形态、尺度都在不停变化,算法很难学习到统一的目标表征;(2)目标在运动中会存在被遮挡、运动模糊、消失-重出现、环境光线变化等复杂情况,算法往往依赖极强的时序关系,才能进行准确推理。(3)感兴趣目标的分割,往往会受到相似目标的干扰,从而错误的分割了其他目标,造成预测的漂移。本文以时空匹配为切入点,重点研究当下流行的注意力结构以及模板更新,利用时间记忆网络和动态模板特征更新,建立起视频数据的时序联系。本论文的主要工作如下:(1)针对目标表观变化降低模板匹配准确率问题,我们提出一种动态模板匹配更新策略。不同于现有算法使用从第一帧提取的固定特征模板,我们考虑了目标表观变化带来的模板不一致,通过按照特征相似度进行融合,逐步将模板特征迁移到新状态上,得到了更好的匹配效果。(2)针对目前时序注意力机制存在高额计算复杂度以及包含冗余计算问题,我们分别提出基于稀疏特征匹配对齐机制和基于可变形特征对齐机制,在显著降低计算量的前提下,保证了模型性能的不降低。(3)本文从时间、空间两个角度出发,综合了动态模板更新和我们提出的高效时序特征对齐,提出了一种新颖的视频目标分割的网络结构、基于空间先验的上采样模块以及跨尺度融合的轻量型解码器,并给出详细的对比实验,论证了我们方法的有效性。本文提出的方法与使用深度学习的一些其他代表性视频目标分割算法进行比较,分别在DAVIS17 test-dev和Youtube-VOS 2018上获得了72.7%J&F和78.5%G,在Youtube-VOS 2018上比AFB-URR高出2.9%,在DAVIS17 test-dev上比STM高出0.5%。
其他文献
回旋管是具有最高输出功率记录的快波器件,在空间通信、热核聚变与医疗诊断方面受到广泛的关注,伴随着其工作频率的增加,回旋管将大幅提升对磁场的需求,采用高次谐波有助于降低工作磁场,但同时也会加剧模式竞争。与传统的热阴极相比,场致发射冷阴极几乎能够支持瞬态开启,满足超紧凑的设计要求以及工作在室温条件下。基于碳纳米管(CNTs)冷阴极的电子发射源已被广泛证明具有高电流密度、优异的化学和热稳定性、低开启电压
随着在医疗监测和能量采集等领域的突出表现,柔性电子技术引起了人们的广泛关注。由于其柔软的特性,可运用在皮肤表面等,实现电子设备的可穿戴,为一些应用提供大量的新功能。可穿戴设备领域发展的一大趋势就是柔性光电传感器的使用。其中,基于GaSe/MoS2异质结的光电探测器可借助于其材料优异的光电特性和异质结的辅助,实现从可见光到近红外光的高性能探测。然而现有的基于GaSe/MoS2异质结的光电探测器大多基
GaN材料作为宽禁带半导体,具备优良的材料特性,被广泛应用于功率半导体器件中,具有较高的研究价值。国内外GaN基功率二极管的相关研究表明,目前GaN基功率二极管中存在结边缘电场集中效应以及电场非均匀分布的问题,严重制约了GaN基功率二极管的耐压提升。本文针对GaN基功率二极管的耐压结构和温度特性进行了深入研究,取得的研究成果主要如下。首先,为解决GaN基功率二极管中存在的电场非均匀分布的问题,本文
现代雷达以及电子对抗系统的不断发展,促使着电磁波的使用频率在低频端向P波段扩展,吸波材料的应用在P波段已越来越广泛。反射率是衡量吸波材料性能好坏的重要微波指标,其值与所处环境温度、电磁波的入射角以及电磁波的极化方式等都有着密切的关系。常见的吸波材料在P波段的反射率在-20d B左右,但此数值在不同的电磁波波段、入射夹角和极化形式下,浮动将会更加明显,特别是尖锥形的吸波材料,在频率较高时或较大入射角
随着5G时代的到来,能够使用的通信频带资源已经非常有限,工作频率不断增大,要能在狭小的通频带间进行信号的传输,对滤波器的功率容积和过滤性能提出了更加苛刻的要求,而且由于安装空间有限,对滤波器的尺寸也有了更高的要求。所以基于谐振腔的紧凑型微波滤波器的设计是极具应用价值的。本课题主要在电磁扰动理论,调谐理论以及微波腔体滤波器理论的基础上,开展了基于谐振腔的紧凑型微波滤波器设计,通过采用介质和电容加载的
现场可编程门阵列(Field Programmable Gate Array,FPGA)由于其特有的可编程特性,十年前在航空航天、工业、汽车等领域具有广泛的市场。如今FPGA的市场规模仍在不断扩大,开始在人工智能、机器学习、视频处理、大数据处理等领域发挥作用。FPGA是由比特流进行编程配置来实现不同的功能,储存配置比特流可以用几种不同的技术来实现,分别是SRAM、反熔丝与Flash。本文讨论的是F
随着无线技术的飞速发展,基于5G应用的毫米波技术研究变得越来越广泛且流行。为了满足5G甚至6G通信系统的高数据传输速率要求,毫米波通信系统应具有实现波束形成和扫描的能力,所以毫米波相控阵系统被认为是下一代通信系统。而开展基于CMOS工艺的毫米波幅相控制模块的设计与研究,对于提高毫米波电路性能、降低系统成本、推动民用毫米波相控阵系统的开发与应用都具有巨大的学术价值与潜在的市场价值。首先本文介绍了相控
石油、天然气、煤炭等地下矿产资源对于我国的工业发展起着至关重要的作用。目前我国的矿产资源开采区域正在逐渐扩大并且逐步提高开采效率及质量。瞬态脉冲井中雷达作为一种十分有效的探测地下资源分布的工具得到越来越广的应用。作为瞬态脉冲雷达的一类分支,井中雷达能够深入地下矿井中,主要解决井周物质的分布问题,且具备实现超前探测的优势。传统的井中雷达采用的系统接收机、数据采集板、数据传输采用分离式的架构,接收机接
煤、原油、天然气、油页岩此类非可再生资源对人类的生产生活具有相当重要的意义。开采这些不可再生资源时,探测技术尤为重要,使用先进的探测技术有利于降低勘探成本,更有效率地发现油气资源。在地下资源探测中,随钻电磁波传输技术是当前研究中的重点之一。由于在地层中电磁波的传输特性,电磁波衰减相较于在空气中有着非常明显的差别。高频电磁波基本上难以运用在介质为地层的传输系统中,由于衰减特性和实际钻井平台的噪声大等
相对论返波振荡器因高效率、高功率等特点常常作为多频高功率微波源。传统的相对论返波振荡器主要工作模式为TM01模,而TM01模式电磁波的辐射方向图是一个空心圆锥,微波能量分散,能量往往不能被有效的利用。实际工程中,为了提高微波的传输效率,通常需要使用模式转换器将TM01模式转换为其他模式以方便微波辐射。但是,使用模式转换器往往也会带来系统整体尺寸过大或者输入输出不同轴等问题。本文设计了一种能够直接输