基于关键帧提取与定向的重复视频检索

来源 :天津大学 | 被引量 : 0次 | 上传用户:bluesky8013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的不断发展以及视频制作成本的降低,大量的重复视频在造成侵权行为的同时,也造成了视频的重复存储,导致资源的严重浪费。重复视频检索方法是一种判断查询视频是否与数据库中视频重复的方法。现有的重复视频检索方法通过对视频均匀采样来提取视频关键帧,再利用神经网络对视频关键帧进行图像特征提取,最后将图像特征融合为视频特征以进行特征匹配。神经网络虽然能在高维空间中整体表示图像特征,但无法将旋转后的图像与原始图像在高维空间中相似;并且均匀采样无法确定图像信息是否完整。因此,如何快速、准确地提取视频的主要帧内容,构建对于旋转的重复视频有较高检索准确率的重复视频检索方法,是一项重要且富有挑战性的研究。本文提出了一种关键帧提取与定向的重复视频检索技术。定向技术的引入,有效解决了旋转图像所存在的图像特征相似度低的问题,因此本文将定向技术与神经网络相结合,提出了一种关键帧提取与定向的重复视频检索方法。首先采用帧间差分方法得到包含视频主要信息的视频关键帧;再结合定向技术,将图像旋转到统一方向;然后利用神经网络对视频帧进行特征提取;最后进行特征检索。本文将所提方法在VCDB数据集上进行网络训练,在CC_WEB_VIDEO数据集上对网络效果进行测试。此外,针对CC_WEB_VIDEO数据集中的旋转类视频数量较少、视频操作不明确等问题,本文先对其进行数据增强。之后采用所提出的关键帧提取与定向操作,在重复视频检索工作中进行消融实验,并对比实验结果。实验结果表明,关键帧提取方法在CC_WEB_VIDEO数据集中的检索准确率达到了96.3%,本文所提出的基于关键帧提取与定向的重复视频检索技术对旋转重复视频的检索准确率达到了96.2%,验证了所提方法的有效性与鲁棒性。综上,本文通过对CC_WEB_VDIEO数据集进行增强,探讨了针对旋转类重复视频的有效检索,利用关键帧提取与定向技术与神经网络相结合的方法进行旋转重复视频的检索,为准确检索旋转重复视频提供一个有效可行的方法。
其他文献
近年来,人口老龄化和空巢化的加剧使得养老服务领域的需求进一步升高。由于老年群体本身所具有的特殊性,在海量的数据中获取到匹配的服务变得更加困难。现阶段针对老年人的推荐算法考虑维度较为单一,需要考虑更多的维度使得对服务对象的刻画更加明确。老年人群体的描述有很多不同的维度,从多种方式得到的数据具有复杂的数据类型,模型转化也存着较大的困难,在保留客户特征的前提下处理高维状态下的多模态数据成为棘手的问题。此
学位
X线头影测量分析是正畸临床辅助检查的重要手段之一,患者拍摄X线头颅侧位片后,正畸医生在X光片中对牙颌、颅面等标志点描绘特定的线角,计算线距,从而分析相应的解剖结构特征,并据此做出相应的诊疗方案。解剖学标志点的定位是头影测量分析中的关键问题,每张侧位片中包含了数十个标志点,反映了牙颌、颅面软硬组织结构的发育情况及相互关系。由于X射线成像的限制,头颅侧位片存在组织结构重合、不对称,成像不清晰等情况,手
学位
随着信息技术与互联网的发展,越来越多的人参与到社区中进行交流、评论、转发,这使得社交网络的分析越来越复杂。网络分析通常是一个繁杂的过程,如何有效的在网络中找到所需的节点成为了一个值得研究的问题。本文提出了一种基于网络嵌入的方法,使用非负矩阵分解或神经网络的方式,将网络的文本信息和结构信息进行联合嵌入,从而得到网络表示矩阵,同时将用户指定的文本信息和结构信息进行向量化表示。最终根据用户指定节点属性的
学位
人机交互(HCI)很大程度上取决于手的行为检测,例如手部动作识别,手势识别等。然而,在许多人机交互情况下,例如手指指示、点击等,指尖检测则更为实用。在一般的目标检测中,尽管目前已经取得了长足的进步,但是细粒度的目标检测,例如指尖检测,由于其外观特征十分有限,对于现有方法仍然是一个挑战性的问题。先前工作都将指尖检测视为两个独立的任务,分别为手部检测和指尖检测;此外,在指尖检测过程中,先前的方法只能处
学位
虚拟现实(VR)是近些年兴起的一种技术,已经在很多领域有了实际应用,这其中就包括电子游戏。比起诸如军事、医学、工业仿真等其他领域,电子游戏对于技术方面的要求更高,同时需要给玩家展示更为完整的宏观世界。随着VR设备的逐渐普及,越来越多的VR游戏将会走进人们的日常生活中。本文旨在以坐落在骊山脚下的秦陵地宫为背景,虚构了故事线索,使用虚幻引擎设计并开发一款基于沉浸式头盔设备,以秦帝陵为背景的VR FPS
学位
发音依赖于多个发声器官的协作,采集和观察发音器官的协同运动可为语音研究提供多模态数据的同时,有利于发音机理的研究。但由于非侵入性仪器较多,无创检测辅助设备的设计已经成为多模态发音研究的重要领域。因此,本研究旨在提高超声换能器稳定设备的稳定性,实现与电声门图仪(EGG)对舌和声带数据采集和分析的协同。本研究设计一个用于稳定超声探头和EGG配合使用的设备。在确保头部和超声探头可以自由灵活的移动的前提下
学位
常用的时间序列预测方法主要有以下三种:基于传统统计学的方法、基于机器学习以及深度学习的方法,而且每一种方法都有各自的优势和应用场景。由于现实生活中时间序列的场景比较复杂、特征比较多,无法通过一个通用的模型实现对全部类型时间序列的精确预测。所以在很多场景下,以上方法的预测效果无法满足需求。本文提出了一个新的时序预测框架,用于解决不同时间序列的预测问题。该框架主要包含数据清洗和数据预测两大部分。针对数
学位
软件生态系统往往处于不断演化的过程中,因此对软件生态系统的演化过程进行研究分析具有十分重要的意义。Android系统中的应用框架层由众多的项目仓库组成,这些项目仓库互相依赖形成了协同演化的软件生态系统。Android的应用框架层给数百万的Android APP提供众多有用的API,它的演化会影响到众多Android APP的健壮性和稳定性。在本文中,我们提出了一种对软件生态系统的代码依赖网络进行演
学位
在自然语言处理中,语言模型是一重要研究方向。近年来,研究者发现在自然语言中存在着量子性质,因此涌现出各类基于量子力学框架的语言模型,在各个自然语言处理任务上达到了不错的效果。然而,现有的量子语言模型存在一些问题,原始的量子语言模型基于非神经网络框架,对模型进行训练,使模型的推广受到极大的限制。基于神经网络框架的量子语言模型在建模文本表示时,模型会忽视文本数据的序列性和文本理解的动态性。本文对现有的
学位
2018年5月23日中央审计委员会第一次会议中,习近平总书记强调党对审计工作的领导,落实并发挥审计在党和国家监督体系的重要作用。论述财政资金绩效审计的意义,分析我国财政资金绩效审计的不足,探讨提高财政资金绩效审计的对策,意在为提高财政资金绩效管理水平提供有益参考。
期刊