基于卷积神经网络的视频语义场景分割研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:cw545400
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术和互联网的迅猛发展,以视频方式记录的信息越来越多。如何对海量的视频信息做到有效地储存和管理,如何快速的从其中检索到所需求的视频,已成为亟待解决的热点问题。经过多年以来的研究,视频镜头分割技术已逐渐趋于稳定,基于镜头分割结果的视频场景分割技术将成为更有意义的研究热点。视频场景分割技术以镜头作为研究对象,根据镜头内容和时间上的联系把相似的镜头划分为同一场景。这样可以将一段视频切分成若干个逻辑故事单元,具有重要的现实意义。首先,介绍了两种镜头分割算法。一种是本文提出基于边界系数模型的镜头分割算法,利用镜头边界系数对视频进行镜头的突变和渐变边界检测,得到视频的镜头分割结果。另一种是基于差异极值矫正的镜头边界检测算法,在进行镜头边界检测时,为了纠正由于某些原因导致属于同一镜头的两帧间距离超过阈值这一误检,算法定义了一个误差峰值,当两者之间的距离仍大于此峰值时,则认为镜头在此处确实发生了突变或渐变。其次,在确定了镜头分割算法后,提出了一种基于卷积神经网络语义分类的视频场景分割算法。首先通过利用训练视频集构造卷积神经网络,然后用训练好的网络对测试视频镜头进行处理,得到测试视频镜头关键帧的语义概念向量。最后结合本文提出的基于语义向量的镜头重叠链算法对镜头进行聚类。该方法减少了一般场景分割算法中特征选取和阈值设置不当给聚类结果带来的负面影响,通过在RAIDataset数据集上的一系列实验以及其他场景分割算法的横向比较,在实验效果上,本文算法均有着较高的分割准确率。
其他文献
这是一个值得我国教育工作者深思的问题.1.德国幼儿园没有小班、中班、大班之分,所有年龄的孩子都混在一起.2.德国小学校都是半日制的,下午没有课,只有课外活动.3.英语三年级
本文主要针对传统的减速器传动系统之中所存在的一些问题,并结合现有对内齿轮与鼓形蜗杆的一些相关研究理论,提出了一种基于鼓形蜗杆和可变内齿轮内啮合的新型传动装置。该传动装置融合蜗杆传动与三位一体设计方式的优点,使该新型传动装置的体积相对较小,重量轻,同时也有着侧隙可调和补偿磨损的功能。本文主要从理论和仿真的角度进行结构与传热学研究,围绕该传动装置的数学建模理论、三维建模、功耗损失、热力耦合和温度场等几
TD-SCDMA国内规模试验正在如火如荼地开展,同时TD-SCDMA的国际化步伐也正在逐步加快。TD-SCDMA的龙头企业大唐移动正在与SK电讯、香港无线发展中心等开展了广泛的TD—SCDMA试
随着物理学的深入发展,特别是自1901年以来百余年中一个个诺贝尔奖成果的相继出现,以及物理哲学研究的不断深化,人们越来越认识到,物理学的发展与人类文化休戚相关,物理学一
对碳钢在海水淡化一级反渗透产水中生成的锈层进行SEM、IR和XRD分析,并结合电化学测量,研究其腐蚀行为。结果表明,碳钢在一级反渗透产水中腐蚀过程受氧扩散控制,腐蚀产物包括7-Fe
<正>城镇化是综合了人口学、地理学、社会学、经济学,针对农村经济发展而提出的一个范畴。所谓城镇化,是由社会生产力的变化所引起的人类生产方式、生活方式和居住方式变革的
会议
棉花是中国重要的经济作物,也是世界上极为重要的天然纤维作物。随着纺织工业技术的快速发展和日益增长的人口需求,对棉花品种的产量和纤维质量要求越来越高,产量高、纤维长、强度适宜、细度好、整齐度高的棉花品种才能满足人类对棉纺织品舒适性、耐用性日益增长的需要。本研究选取来自于国内不同省份的159份棉花种质资源为材料,通过(安阳)试点的田间调查和测定共15个性状,通过大量的数据,统计方法,诠释主要数量性状间
采用超声分散纳米SiO2,同时添加分散剂保护新生纳米SiO2粒子,在一定程度上改善了纳米SiO2团聚的现象,并将分散好的纳米SiO2加入氟碳面漆,用以改性氟碳面漆的性能。选用硅烷偶
本文从国内外文献研究入手,立足比特产品定价理论和动态定价理论,提出了复制型比特产品和共享型比特产品的概念,分析了影响比特产品动态定价的关键因素,分别构建了复制型比特
热电材料的基本特征是将热能直接转化为电能,本质上采用固体载流子输运能量。高性能热电材料的研究突破,能够满足能源材料的基本要求,有利于解决日益严重的能源危机。PN结在