基于深度学习的细粒度体育视频描述研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：zhouyulu1200

【摘要】

：

视频描述技术指的是通过构建神经网络来挖掘视频中的图像信息及含义,并将其以便于人为理解的文字形式输出描述语句或段落的技术。通过这样的技术,将信息从冗余度较高的视频形

【作者】

：

郁环宇

【出处】

：

上海交通大学

【发表日期】

：

2004年期

【关键词】

：

视频描述细粒度深度学习循环神经网络体育视频解说

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

视频描述技术指的是通过构建神经网络来挖掘视频中的图像信息及含义,并将其以便于人为理解的文字形式输出描述语句或段落的技术。通过这样的技术,将信息从冗余度较高的视频形式转换成冗余度较低文字形式,这在如今信息高速膨胀的时代有着巨大的意义,并已广泛应用在视频检索、行为定位及内容过滤等方面。近几年来,视频描述生成技术有了很大的发展,并涌现出了很多生成方法,解决了如动作定位、多句生成等技术问题。但是怎样去生成细粒度的视频描述(也就是对时间跨度长且细节丰富的视频中,多个主体的细节动作及主体间频繁的交互的描述)问题还远远没有得到解决。而这个问题却有着很大的应用价值,比如用来进行体育视频的自动解说。为此,本篇论文提出细粒度视频描述技术,并致力于通过该技术解决细节及交互丰富的体育视频解说问题。为了实现这个目标,这个工作做了以下努力:首先,为了研究这个细粒度视频描述的新课题,本文创建了一个全新的数据集——细粒度体育视频描述数据集(FSN)。这个数据集包含了一万两千个来自Youtube网站的高清篮球和排球体育视频,并且每个数据集都具有人工标注的动作时间窗格节点及段落语句描述。这个数据集包含了该课题需要面对的细粒度动作、多主体交互等核心挑战。其次,本文提出了一个新的视频描述评价标准——细粒度视频描述评估准则(FCE)来为这个新的课题提供更合理的评估标准。FCE在目前广泛使用的评估标准METEOR的基础上进行了改进,不仅对语义方面的结果进行评估,还对细节动作的准确性以及动作的描述顺序正确性方面进行了考量,而后两者恰恰是在细粒度视频描述中非常重要的方面。最后,本文为细粒度体育视频描述任务提出了一个新的深度学习神经网络框架,这个神经网络包含了三个子网络:(1)时域窗口-空域实体定位及人物角色判断子网络,该网络需要对视频中不同时域动作窗口进行分割,并对每个窗口中的人物进行定位和身份判断。(2)一个利用骨骼信息进行细粒度动作建模子网络,通过改进的骨骼描述算子来提高细节动作的识别精度。(3)一个用于挖掘运动员之间交互行为的群体交互关系建模子网络。得到了这三个子网络的输出特征之后,我们进一步对这些特征进行融合,并通过一个h-RNN循环神经网络进行编解码最终得到一段描述文字。本工作在FSN数据集上做了大量的实验,并通过多个评价标准结果论证了本文所提出的细粒度视频描述方法对于解决体育视频解说问题的合理性,此外本文也与当前已公布的主流视频描述算法进行了同等条件下的对等比较,结果也证明了本文所提出算法的有效性和优越性。

其他文献

复合结构表面上液氮喷雾蒸发传热特性的实验研究

随着微电子行业、航空航天工业、激光医疗等领域的发展,高集成的电子元件以及大功率设备产生的大量热量严重影响着设备的性能与安全,因此寻求高效、安全的高热流密度散热方式

学位

喷雾冷却复合结构非稳态传热液氮

近岸海域水体中纳米颗粒态Fe、Ti分离提取及测定方法的研究

本文利用切向超滤系统分离提取近岸海水中的纳米态Fe和Ti,并通过流动注射-固相萃取的方法对样品进行脱盐富集处理后使用ICP-MS测定,建立了适用于近岸水体中纳米态Fe和Ti的同

学位

切向超滤流动注射ICP-MSFeTi

咸阳地区中学生主观幸福感与学业成就的相关研究

主观幸福感是衡量个体生活质量的重要指标。聚焦中学生的主观幸福感,探究影响主观幸福感的因素,帮助他们获得主观幸福感,不仅关乎中学生的健康成长,同时也是心理健康教育的核心追求。学业成就是评价中学教育质量的重要标准,研究主观幸福感与学业成就之间的关系,能够帮助学校教师从学生情感发展方面了解学业成就的影响因素,在提升中学生主观幸福感的过程中提高其学业成就。本文抽取咸阳地区5所中学600名中学生作为被试,采

学位

周向拉杆转子—轴承—密封系统动力学特性研究

重型燃气轮机由于其热—功转换效率较高,在船舶以及发电等领域应用广泛,具有举足轻重的战略性地位。经过数十年的研究和发展,重型燃气轮机的结构形式越来越丰富,其内部的转子

学位

周向拉杆转子粗糙表面接触刚度临界转速不平衡响应

硫化物半导体材料的调控合成及其光催化产氢性能研究

高效稳定和宽光谱相应的光催化产氢体系是应对当前能源和环境问题的有效解决途径之一。一般而言,金属硫化物因具有合适的能带结构而呈现较好的可见光响应和光-能转换性能,但

学位

光催化产H2AgIn5S8层状异质结构MoS2C3N4D-A聚合物

氮杂环类阴阳离子识别受体的合成以及荧光性能的研究

本论文共分为四章:第一章:本章主要介绍了各种含杂原子的有机荧光分子以及对阴阳离子的识别进展。主要内容为:（1）对分子识别的定义以及研究内容的概括;（2）受体分子的基本结构和特

学位

荧光受体萘吡啶Hg2+识别CN-识别连续性识别试纸

异步联网系统送端电网一次调频能力研究

异步联网运行模式能够有效解决交直流混联型电网存在的潮流转移过载风险,然而衡量交直流混联电网是否需要异步运行的标准尚为缺乏。本文基于经济性及稳定性两方面考量,提出了

学位

异步联网一次调频能力直流频率调制模型预测控制

氰醇的绿色合成反应研究

氰化反应是一类重要的有机反应,其中羰基化合物的硅氰化反应近年来深受有机化学工作者们的广泛关注和研究。特别中间体氰醇因其在医药、农药、材料等方面的广泛应用,我们可知

学位

醛酮三甲基氰硅烷非手性硅胶三甲基氯硅烷

小型压水堆稳态运行特性及主蒸汽管道破口事故敏感性分析

小型压水堆(SmallModularReactor,SMR)具有高安全性、布置灵活等优点,近年来成为了国际核工程界的研究热点之一。本文介绍了小型堆的发展过程及设计特点,并以某典型设计的SMR

学位

SMRRELAP5堆芯功率一回路入口温度破口面积MSLB

基于时序模型的推荐算法

随着互联网的发展以及大数据时代的到来,影音资讯、电子商品等各类物品日渐丰富的同时,也使得用户往往需要耗费大量的时间和精力才能找到自己喜爱的物品。而推荐系统可以利用

学位

推荐系统行为预测评分预测

基于深度学习的细粒度体育视频描述研究

与本文相关的学术论文