【摘 要】
:
随着智能手机和视频剪辑软件的日益普及和成本的降低,视频数据量在过去几年里急剧增加。视频已经成为最重要的视觉数据形式之一。根据You Tube的统计数据显示,每分钟有超过300小时的视频被上传到You Tube上。由于视频数据量庞大,用户看完所有的视频并从中识别出有用的信息是不现实的。因此,开发出自动视频摘要技术来帮助用户更加高效率地浏览视频变得越来越重要。视频摘要的目标是生成一个较短的视频以捕获输
论文部分内容阅读
随着智能手机和视频剪辑软件的日益普及和成本的降低,视频数据量在过去几年里急剧增加。视频已经成为最重要的视觉数据形式之一。根据You Tube的统计数据显示,每分钟有超过300小时的视频被上传到You Tube上。由于视频数据量庞大,用户看完所有的视频并从中识别出有用的信息是不现实的。因此,开发出自动视频摘要技术来帮助用户更加高效率地浏览视频变得越来越重要。视频摘要的目标是生成一个较短的视频以捕获输入视频中的重要信息。由于其评价标准的主观性,这个问题十分具有挑战性。现有的大多数工作要么是通过设计启发式的标准以一种无监督的方式来摘要视频,要么则是通过人工标注的训练数据以一种监督的方式来摘要视频。但是,无监督的算法通常无法产生语义上有意义的摘要视频因为它忽视了视频本身的信息,而监督算法则很难获取大量具有人工标注的训练数据,因此可能会导致模型产生偏差。为解决上述问题,本文提出了一种基于视频热度的弱监督摘要算法(PDSN),该算法仅利用易于获取的视频热度信息(例如点击量,播放量,收藏量)来生成摘要视频。具体来说,PDSN包含两个模块,首先是摘要模块,我们通过策略梯度算法训练摘要网络;其次是评估模块,我们训练一个热度评估网络来评估生成摘要的质量以提供训练摘要网络的奖励。在三个基准数据集(Sum Me,TVSum和Co Sum)上进行的大量实验表明,与最近提出的几种方法相比,PDSN达到了最佳的性能。本文的主要创新点如下:(1)据我们所知,本文是第一个将视频热度信息应用于视频摘要的工作。(2)PDSN是弱监督算法并且仅需要视频级别的热度信息,这可以极大减少人工标注的成本。(3)不同于其他基于强化学习的视频摘要算法,PDSN使用热度评估网络作为奖励函数,训练的目的是通过生成高质量的摘要视频来最大化一段时间内的期望奖励。(4)PDSN在性能上不仅超过了最新的无监督视频摘要算法与大部分的弱监督算法,而且超过了一部分监督算法。(5)设计并实现了一个基于广告视频点击率的视频摘要服务,可以最大化在线广告平台上广告视频的预估点击率。本文共分为六章。第一章介绍视频摘要的研究现状以及待解决的问题。第二章给出视频摘要的具体定义与相关算法介绍。第三章介绍基于视频热度的弱监督视频摘要方法。第四章介绍详细的实验结果和分析。第五章介绍基于广告视频点击率的视频摘要服务。第六章对全文做出总结并做进一步展望。
其他文献
如今,随着照明与显示应用的普及,以及人们生活水平的提高,高标准的显示技术的需求越来越迫切。目前大多数显示背光源的光源采用的都是荧光粉,受限于较大的荧光半高宽,使得显示器件的色彩性能较低。近年来,量子点、纳米片这一类新型的胶体半导体材料受到了广泛的关注,窄线宽、高色纯、光谱可调、以及高量子产率,使得它们成为了研究的热点,在照明与显示等前沿领域展现出了光明的前景。本文主要探讨CdSe纳米片在显示背光源
过渡金属硫化物(TMDC),如二硫化钼(MoS2)、二硫化钨(WS2),作为一类具备特殊晶格结构和纳米尺度效应的二维材料,因为其优异的电学和光学性能,在新一代光电子器件等方面具备较大的应用前景。化学气相沉积方法可以用于制备高品质、大面积的TMDC材料。更进一步的,利用转移的方法可以将化学气相沉积法制备的TMDC材料进行集成制备出范德瓦尔斯异质结。本文首先研究了化学气相沉积方法制备MoS2和WS2的
半极性(11(?)2)面AlGaN材料作为深紫外发光二极管(UV-LED)有源区材料可以有效抑制传统c面AlGaN的量子限制斯托克斯效应(QCSE),而AlGaN纳米柱结构则能够极大地提高UV-LED的光提取效率,因此结合两者优势制备半极性(11(?)2)面AlGaN纳米柱对于制成高外量子效率的UV-LED具有重要的科学意义和研究价值。本论文采用金属有机化合物化学气相沉积生长技术和纳米球刻蚀技术,
电子具有电荷自由度,电子还有另一种内禀属性——自旋自由度。传统的电子器件是通过控制电子电荷自由度来实现信息的处理。但是,由于量子效应的存在,“摩尔定律”的失效使得基于电荷自由度的电子器件的微型化,和集成化出现了瓶颈。近些年来,通信和信息技术得到了高速的发展,由此引起的信息量的暴增对磁记录的三个方面——写、存、读提出了新一轮的挑战。计算机硬盘上的磁盘存储量在过去十多年的时间里一直呈倍数增长,与此同时
在纳米光学的应用领域内,表面等离激元共振纳米结构将入射光波局域在亚波长尺度,可实现对光场纳米级的调控。其表面等离激元效应可有效增强纳米结构附近的电场强度,提升对入射光波的利用效率和响应度,被广泛应用在荧光增强、表面增强拉曼、生物成像、光电探测等领域。为了丰富表面等离激元共振纳米结构在纳米光学领域中的应用,进一步提升光电器件从可见到红外波段的响应,本论文制备出了局域表面等离激元谐振(localize
随着社会对能源和环境问题关注度的增加,消耗大量化石能源的内燃机汽车将逐渐被电动汽车和混合动力汽车代替。应用于电动汽车的无线充电系统凭借安全性、充电过程自动化、维护成本低、消耗土地面积少的优点,正在得到越来越多的关注。本论文介绍了一种新型的基于矩阵变换器的电动汽车用双向无线充电系统设计,其优点在于:(1)使用直接式矩阵变换器,能实现一步式AC-AC转换,避免了不可靠和体积大的直流电容器,提高了系统的
肿瘤相关酶广泛存在于肿瘤细胞中,其存在和量变可以揭示肿瘤的性质。肿瘤相关酶的定量检测在肿瘤的早期发现、诊疗和预后判断等方面都具有非常重要的研究意义和临床应用价值。因此,建立低成本、灵敏度高、特异性强、操作简单的肿瘤相关酶检测方法极为重要。近年来的研究表明,DNA损伤修复酶--聚腺苷二磷酸核糖聚合酶-1(PARP-1)与肿瘤的发生、发展等过程密切相关,而且PARP-1在肺癌、乳腺癌、口腔癌、卵巢癌、
高导电和高电导应变稳定性的导电纤维是可穿戴医疗设备、能源收集织物、软显示屏及智能服装等新型应用的重要材料。然而,目前实验室研究的方法制备过程复杂、成本高、电导应变稳定性低,极大限制了该材料的广泛应用。为了满足高导电纤维材料在实际市场和研究中广泛应用的需求,本论文使用具有良好导电性和变形耐久性的一维纳米材料作为导电涂层,设计了基于电晕处理的同轴喷嘴多次包覆的工艺来制备高导电有机纤维。通过多元醇法制备
混凝土作为一种广泛使用的建筑材料,其力学性能直接关系到建筑结构的安全性。近年来环保成为建筑工程中普遍呼吁的发展趋势,由于陶粒混凝土材料的广泛应用可以实现资源的循环利用,达到节能减排以及低碳发展的作用,因此陶粒混凝土作为新型绿色材料得到广泛的关注。而陶粒作为一种抗拉强度较低的材料,其力学性能不像碎石骨料,裂纹往往由陶粒中萌生进而扩展。因此开展混凝土及陶粒混凝土的力学性能的研究便尤为重要。本文以混凝土
隐私保护是工作流调度的重要问题。本文考虑大数据处理计算框架下的Spark应用的截止期约束和任务隐私约束,以最小化企业总租赁成本为优化目标,研究混合云环境下Spark工作流调度问题。该问题的主要挑战有:(1)如何在保证在任务隐私性约束下实现完工时间和租赁成本的平衡;(2)Spark应用的Job和Stage双层偏序关系及可并行执行的Task任务形成大量拓扑顺序,如何确定合适的Stage调度顺序以实现租