基于帧得分的视频摘要方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户：luckyxiaoxi

【摘要】

：

【作者】

：

王鈃润

【出处】

：

山东大学

【发表日期】

：

2019年09期

【关键词】

：

视频摘要排序学习卷积神经网络跨模态相似性

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着视频采集设施的普及以及互联网技术的发展,人们可以很方便地在互联网上分享视频,这使得互联网上的视频数据呈现爆炸式的增长趋势。视频数据的增加一方面可以丰富人们的社交生活,但同时也不可避免地造成一些问题,例如,用户浏览视频时间变长,视频检索速度变慢,视频网站需要更多视频存储空间等。为解决这些问题,视频摘要技术逐渐兴起并引起广泛关注。摘要是对原始视频内容的概括和浓缩,从原始视频中选出可以概括视频内容的静态视频帧或动态视频片段组成视频摘要。视频摘要的长度远小于原始视频,因而用户能够在较短的时间内了解视频内容。另外,利用视频摘要技术还可以加快检索速度,同时也可以节省视频网站的存储空间。现有的视频摘要方法大多首先根据人对视频摘要属性的主观判断和约束(例如代表性、重要性等),建立相应的数学模型,然后利用构建的数学模型对候选打分,最后通过线性或非线性地融合策略获取候选摘要的属性分数,并利用属性分数作为选取视频摘要的依据。但是,这些构建的数学模型有时候并不一定能够准确地体现视频摘要的属性,而且根据个人经验或偏好定义的属性也很难满足所有用户需求。另一方面,一部分视频摘要方法是对视频帧子集打分,选取得分最高的子集作为摘要,而视频帧子集往往也是数目庞大,计算复杂度也偏高。针对这些问题,本文应用机器学习算法,实现对视频帧的自动打分,提出两种基于帧得分的视频摘要方法——基于排序学习的视频摘要和基于跨模态相似性的视频摘要。(1)在基于排序学习的视频摘要方法中,视频帧的分数代表视频帧与视频内容之间的关系,分数高说明该视频帧可以更好的体现视频内容。基于排序学习的视频摘要方法选取分数高的视频帧组成摘要。在该方法中,为了使得学习得到的排序函数可以更好的符合人对视频摘要的认知规律,该方法首先通过概率分布函数得到排序函数对视频帧排列的概率分布,同时,得到数据库中人工对视频帧排列的概率分布。最后用交叉熵损失衡量两个概率分布的差异,损失最小时对应的参数就是最优参数,此时的打分函数也很好地模拟了人对视频摘要的认知过程。该方法的主要思想是模拟人的视频摘要的认知过程来对视频帧打分,相比于对视频帧子集打分的方法,计算复杂度显著降低。另外,该方法没有预先规定摘要必须具有某些属性。因此,基于排序学习的视频摘要方法在一定程度上克服了现有方法的缺点,在数据库上的良好性能也表明了该方法对视频摘要任务的有效性。(2)基于跨模态相似性的视频摘要方法主要是利用文本信息生成视频摘要。相关研究成果表明,视频文本信息反映了视频描述内容,因此可以挖掘文本信息协助生成视频摘要。基于跨模态相似性的视频摘要方法首先利用深度学习模型计算文本到视频帧空间的相似性和视频帧到文本空间的相似性,然后融合两种相似性作为最终的视频帧与文本的相似性得分,相似性得分较高的帧被选为摘要。该方法在利用两个模态相似性的同时也考虑了模态各自的特有信息,充分利用了视频的文本信息,进而提升了视频摘要选取的精度。基于跨模态相似性的视频摘要方法也是对视频帧计算分数,也没有人为约束摘要,在某种程度上克服了现有方法的缺陷,实验结果验证了该方法的合理性和有效性。

其他文献

内蒙古蒙古语与喀尔喀蒙古语词汇差异原因探究

蒙古语言不仅是蒙古族人民交际的工具，而且也是蒙古民族精神财富的宝库。蒙古族语言文化研究是中国蒙古学的新兴学科领域，也是世界蒙古学科研究领域中的重要组成部分。当前，蒙古

期刊

蒙古语词汇固有词借词

环氧合酶-2及其选择性抑制剂对视网膜母细胞瘤生长增殖的影响

目的：观察人视网膜母细胞瘤HXO-RB44细胞中环氧合酶—2（cyclooxygenase-2，COX-2）的表达情况，以及选择性COX-2抑制剂尼美舒利（nimesulide，NIM）对该细胞株生长增殖的影响。为选择性COX-

学位

视网膜母细胞瘤环氧合酶-2选择性环氧合酶-2抑制剂尼美舒利

脑出血手术患者护理中临床护理路径的应用研究

目的研究脑出血手术患者护理中临床护理路径的应用价值。方法选取本院收治的40例脑出血患者,采用双色球法将其分为两组各20例,对照组实施常规护理,观察组实施临床护理路径,比

期刊

脑出血临床护理路径并发症满意度

FTP超大文件断点上传技术研究

通过分析FTP超大文件上传的技术实现方法,对断点续传在算法复杂性上进行讨论,提出了基于事务完整性的解决方案,并在实践中得到了成功应用。

期刊

FTPSOCKET超大文件上传断点续传

浅析英语与中国旅游文化

改革开放30多年来,中国的经济有了突飞猛进的发展,2009年底我国超越了日本成为了世界第二大经济体.伴随着经济的发展,我国的旅游业也取得了十足的发展,无论是入境和出境旅游

期刊

英语中国旅游文化相互作用问题对策

基于金融数学技巧的期权定价研究

金融数学知识对期价的作用越来越显著，因此现今借助金融数学方法来研究期权的定价也越来越普遍，金融数学主要涵盖统计学等多门学科，实际应用广泛，对金融投资的风险评估发挥着不可

期刊

金融数学技巧期权定价研究

廊坊市高新技术产业发展现状、问题及对策分析

近年来,廊坊市高新技术产业发展迅速,高新技术产业体系逐步完善,其在廊坊市社会经济发展中的作用日益增强。为此,从产业集聚与产业规模、产业投资分布、产业自主创新能力三个

期刊

廊坊市高新技术产业对策

表达小鼠B7-1基因的重组逆转录病毒载体构建及真核表达

目的构建表达小鼠B7-1基因的重组逆转录病毒载体并在真核细胞中检测其蛋白表达，为进一步利用B7-1基因进行免疫基因治疗作准备。方法提取小鼠总RNA，并用紫外分光光度计进行测定

学位

B7-1载体构建

微创食管癌根治术后肺部感染的相关分析

目的对胸腹腔镜下食管癌根治术后有可能导致肺部感染的因素进行分析和比较研究,以改善日后的临床工作和效果。方法选取2015年12月至2018年9月在我院行胸腹腔镜下食管癌根治

学位

食管癌肺部感染危险因素防治措施

胱抑素C水平与糖尿病足病病变发展的临床研究

为了探讨糖尿病足病(DF)患者胱抑素C(CYS-C)水平与病变发展的关系,对2型糖尿病(T2DM)、T2DM合并DF患者实验室指标进行回顾性研究,并用Logistic多元回归分析影响DF发展的危险

期刊

胱抑素C糖尿病足病2型糖尿病

基于帧得分的视频摘要方法研究

与本文相关的学术论文