基于卷积神经网络的视频镜头边界检测

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:guobinlei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
镜头边界检测是视频语义分析和编辑任务的重要预处理步骤,旨在检测出视频中镜头的切变和渐变,实现对镜头的自动分割;如何高效且准确地识别出视频中的镜头边界仍然是一项挑战。目前大多数镜头边界检测方法基于精心设计的手工特征,检测效果严重依赖于经验确定的参数,可扩展性不强。这些方法往往通过设计更复杂的特征、相似度度量方法或者分类方法以提高检测准确度,计算代价大且实现复杂。针对以上问题,构建了一个基于深度卷积神经网络的镜头边界检测模型。整个模型分为三个阶段。第一阶段初步定位出视频中可能发生镜头切换的位置,使用卷积神经网络的高层输出作为视频帧的特征表示,计算相邻帧之间的差异度,快速排除大部分非镜头边界帧。针对渐变长度多变的特性,采用多个时间尺度对视频进行下采样,然后合并不同尺度下获得的候选边界帧。第二阶段利用三维卷积神经网络识别出候选边界帧中的切变,并基于检测网络输出的渐变概率初步定位出视频中可能发生渐变的位置。第三阶段进一步定位出渐变的时间边界,利用卷积神经网络判断每一帧属于渐变开始、中间和结束三种状态的概率,然后通过定位这三种概率信号的强峰值,确定出渐变过程的起止时间。使用公共数据集ClipShots对模型进行训练并测试。实验结果表明检测模型对切变和渐变都具有不错的检测效果;渐变检测性能略差一些,且存在大量重复计算。如何提高渐变检测性能并减少计算量,还有待于进一步研究。
其他文献
目的:探讨不同口腔鳞癌细胞的缺氧诱导因子-1α的表达水平,阐明口腔鳞癌细胞对5-FU的敏感性是否与其表达水平相关。方法:将OSC2、OSC4、OSC5、OSC6口腔鳞癌细胞培养并检测其缺
氧化锆陶瓷体系因其突出的力学和生物学性能,开始成为国内外口腔生物材料开发的热点瓷材。但是,为了满足临床需求,烧结体难加工问题是其中之一。由于氧化锆陶瓷极高的抗弯强
人才培养质量监控体系是全面提高高职院校教学质量的重要保证。本文通过论述当前国内外的高职院校质量监控体系,提出了适应高职校情的“政府、企业、学校及校内教学部门参与的
目的:探讨血清T—PSA、F—PSA检测在前列腺癌(PCa)诊断中的应用价值。方法:运用酶联免疫方法检测28例前列腺癌患者、50例前列腺增生(BPH)患者和20例健康成年男性血清中T—PSA、F—P
1990年12月25日下午,在吉林艺术学院演奏厅里,戏剧系的小品集锦专场演出拉开了我院第二届艺术节的帷幕。这是我院继1989年底举办的首届艺术节暨建校30周年纪念活动之后的又一
目的:探讨β-胡萝卜素(β-C)在急性出血坏死性胰腺炎(ANP)中对GSH及MDA影响。方法:Wistar大鼠随机分为3组:A组,ANP组;B组,β-C处理组;C组,假手术组,测定各组谷胱甘肽(GSH)、丙二醛(MDA)
永磁同步电机(permanent magnet synchronous motor,PMSM)是一个多变量、强耦合的时变非线性复杂系统,传统PI控制已很难满足对PMSM伺服系统转速控制的高精度要求。本文通过对PMSM矢量控制系统中转速环的设计来提高电机转速的控制精度。复合控制常被用于PMSM的伺服控制系统设计。首先,本文在标准蝗虫优化算法(GOA)的基础上设计了正余混沌蝗虫优化算法(SCCGOA)
目的:分析用白内障摘除术联合人工晶体植入术治疗闭角型青光眼合并白内障的效果。方法:从河南省灵宝市第一人民医院近期内收治的闭角型青光眼合并白内障患者中抽选80例作为研究
广西中医学院骨伤科研究所成立于1992年,现有教授4名,副教授2名。本所主要承担中医骨伤科学的科研、教学、临床工作,以脊柱损伤性疾病为主要研究方向。
期刊