基于无监督学习的视频目标分割技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:ctrl111shift
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及以信息技术的发展,产生了大量的视频数据,针对视频进行高效处理已成为计算机视觉领域的重要研究课题。视频目标分割是视频处理的基础,对于场景理解等有重要帮助,是计算机视觉领域的研究热点。根据目标分割过程中是否有人工干预,可将视频目标分割划分成半监督视频目标分割和无监督视频目标分割。半监督视频目标分割是在给定视频第一帧掩码情况下进行视频后续帧的目标分割。无监督视频目标分割在无人工干预且目标物体未知的情况下,主动找寻目标物体并在视频后续帧中将目标物体从背景中分离出来。当前主流的半监督视频目标分割方法大多基于耗时的在线微调方式,而当前主流的无监督视频目标分割方法需要联合视频所有帧确定待分割目标。以上视频目标分割方法虽然准确率有所提升,但耗时较长,分割效率较低。本文针对以上问题,提出两种视频目标分割方法:基于注意力修正的半监督视频目标分割方法和基于显著性检测的无监督视频目标分割方法。本文主要工作如下:1)给出了一种基于注意力修正的半监督视频目标分割方法。该方法首先构建外观特征提取子网,提取视频第一帧特征图并作为外观指导信息;然后,获取前一帧分割结果作为空间指导信息;最后,构建基于双分支结构的当前帧特征提取子网,通过外观修正通道注意力和位置修正空间注意力将指导信息融入当前帧特征图,从而实现目标分割。2)给出了一种基于多尺度特征引导的显著性检测方法。该方法首先提取输入图像的多尺度特征,获得粗糙显著特征图;然后将粗糙显著特征图作为多尺度高级语义特征信息指导显著特征图的细化,并加入注意力模块实现显著图的特征筛选,得到更好的显著图。3)给出了一种基于显著性检测的无监督视频目标分割方法。首先基于多尺度特征引导的显著性检测生成视频第一帧显著图;然后将视频第一帧显著图作为视频第一帧目标掩码,输入基于注意力修正的半监督视频目标分割方法中,指导视频后续帧的分割。4)设计并实现了基于无监督学习的视频目标分割系统,详细说明了该系统的功能模块和图形界面,并对系统的检测结果进行了分析和评价。
其他文献
本文给出了一维修正的欧拉-麦克劳林公式,并且将它推广到二维情形。随后利用修正的欧拉-麦克劳林公式计算了高能重离子碰撞下有限空间中重夸克偶素的解离。在经典欧拉-麦克劳林公式的基础上,我们将伯努利多项式做傅立叶展开从而找回欧拉-麦克劳林公式中的部分余项得到一维修正的欧拉-麦克劳林公式。通过两次使用这一结果,我们得到了二维修正的欧拉-麦克劳林公式。我们用修正的公式讨论了黎曼ζ函数、量子转子和二维无限深势
近年来,我国社会经济水平的不断发展,使得我国市场经济体制也得到了完善与发展,整个社会的消费结构不断优化、水平持续提高。与此同时,汽车金融、住房金融等各种类型的个人贷款业务,也随着整个金融体制改革步伐的加快和外资银行相关业务先后进入我国而爆发。以上原因造成的个人贷款业务量的日益增长已经成为商业银行新的利润增长点。随着个人贷款业务的迅猛发展,其风险也初见端倪,再加上个人的抗风险能力相比较于组织来说比较
由于大型风电场内的变压设备较多、机组之间的传输线路较长,在实际运行中集电系统损耗突出,对此设计了以风电机组自身作为分布式无功源优化场内功率潮流分布,降低集电系统总体损耗的风电场无功调度优化方案。建立了风电场运行有功损耗优化的数学模型,同时基于改进遗传算法以及粒子群算法进行求解,以对比验证优化过程的收敛性以及优化结果的一致性。同时,为提升风电场建模以及多场景降损优化仿真的效率,设计了一种基于对象模型
社会对残疾的认知经历了从个体型残疾观到社会型残疾观转变的过程,本文就是基于社会型残疾理论视角,运用社会工作专业方法介入智障人士社会融合的实务研究。智障人士作为特殊的脆弱群体,在社会上处于弱势地位,其有限社会融合的原因,不仅是自身感官和心智的缺陷,更多是社会环境和制度的失灵。本文选取社会型残疾观视角来重新看待残疾,核心就在于残疾是社会性的,强调社会与个人的联结及社会对个人的影响,社会应该积极营造宽松
为了满足用户对更高传输速率以及更大带宽的需求,通信网络已经发展成为了由多种接入网络构成的综合通信系统,作为该通信系统中重要的一部分,无线多跳蜂窝网络以其灵活性和易
本文重点围绕应用于终端天线的多频段小型化等关键性技术进行了学习研究。本文提出并设计了多款微带结构的天线。基于天线理论分别提出了一种基于加载技术统一模型的多频小型
背景:自噬是一种依赖溶酶体途径对胞浆大分子物质和细胞器进行降解的过程,在进化过程中高度保守,随着对其机制的深入了解,自噬已经被证明参与多种疾病,包括肿瘤(Yang,Chee et
自第八次全国信访工作会议指出:“利用大数据实现从以偏概全向以全概全转变,为提高信访工作质量提供新途径;通过信息化手段,再造信访工作流程;运用科技挖掘信访数据价值,提高
随着互联网市场的蓬勃发展,大数据中心、云计算以及其他光互连应用对传输速率和传输带宽的需求快速增长。局域接入网中的以太网技术已经经历了从10M、100M、1G、10G到40/100G
在信息过载的当今,人们日常所接受的信息有超过一半是来自视频图像。视频图像作为当今社会的主要信息载体。相比音频文字,它拥有更大的信息量和更直观的表现形式。另外,人们