基于深度学习的重复视频检索

来源 :天津大学 | 被引量 : 0次 | 上传用户:flybear
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的到来,视频的制作以及传播越来越便捷,视频数据大规模增长,拍摄视频逐渐成为了很多人分享生活内容的一种方式,但同时也产生了大量重复视频。视频内容具有一定的经济价值,视频盗版的行为损害了视频制作方的利益,同时也会增加视频网站的带宽和存储成本,不利于视频平台的发展。现今视频网站会根据用户喜好推荐视频,推荐重复的视频会极大影响用户的观看体验。因此需要借助计算机技术识别重复视频。本文提出了一种基于深度学习的重复视频检索方法。首先获取视频帧并输入已预训练的残差网络中,得到网络从低到高不同中间层残差块输出的特征图,并通过RMAC池化方式在特征图上提取特征,合并对网络不同层提取的特征得到视频帧的特征表示。归一化不同视频帧特征得到整体视频特征。然后采用度量学习的方式,对得到的视频特征建立三元组输入,使用Improved Triplet损失,构建并训练孪生神经网络,使用该网络对提取的特征进一步处理,提高重复视频检索性能,并对视频特征进行降维。最后通过乘积量化算法加速视频特征检索。本文贡献了一个大规模的重复视频数据集,同时使用VCDB,CC_WEB_VIDEO数据库,在不同的数据库上评估算法性能,并与其它算法进行对比,实验结果表明本文的方法取得了更好的结果。
其他文献
在经典机器学习问题中,多标记学习作为一个热门的研究内容对现实世界多义性对象的研究具有重要意义,然而在现有的多标记学习算法中都忽略了标签之间具有的不平衡性。很多时候,研究者们更关心实例对于不同标签的隶属度以及其分布情况,因此有研究将多标记数据中的逻辑标记替换成了概率分布的形式,这就得到了标记分布数据。不论是多标记数据还是标记分布数据,都面临着数据规模爆炸式增长的问题。时至今日,针对多标记数据的特征选
近年来,随着互联网技术的蓬勃发展以及文本信息的爆炸式增长,“信息过载”问题愈发严重。如何快速准确地从大量无结构的信息中抽取出用户感兴趣的信息成为当前自然语言处理领域的热点问题。因此,信息抽取技术受到的关注逐年增加。作为信息抽取中的重要子任务,事件抽取旨在从自然语言文本中抽取出指定的事件信息,并以结构化的形式存入数据库中。事件抽取任务分为两个子任务:事件检测和事件论元抽取,本课题主要聚焦于第一个子任
信度分配技术涉及确定系统组件对系统整体性能的贡献,强化学习的成功离不开信度分配技术。在多智能体强化学习领域信度分配主要是合作式环境下各智能体对全局奖励信号的分配。通过研究信度分配机制,来完善或解决合作式多智能体深度强化学习下单个智能体策略更新信号不准确的问题,从而达到提高多智能体学习效率和协作程度的目的。因此,多智能体信度分配是解决合作式多智能体协调问题的关键。然而,一方面之前的研究大多基于差异奖
目标检测是计算机视觉中常见而具有挑战性的任务,传统的目标检测分为滑窗提取候选区域,提取相关特征和对特征分类三个过程。该方法存在的缺陷有滑窗时间复杂和窗口冗余,除此之外,手动设计的特征在目标多样性上没有很好的鲁棒性。深度学习技术不断发展,目标候选区域和相关特征可以通过卷积神经网络来提取,目标检测任务变成端对端的形式。深度学习的检测算法在速度和准确性上有了很大提升。天文学领域中,检测日冕暗化(Coro
数字图像作为信息的重要载体之一,在人们的日常生活、娱乐和工作中发挥着至关重要的作用。伴随着数字图像的广泛传播,人们对数字图像进行修改的需求愈加迫切,由此出现了各种图像编辑软件,如Photoshop、美图秀秀等。尽管这些图像编辑软件给人们带来了极大的便利,但是也给了不法分子可乘之机。如果这些虚假图像被用于媒体、科研、司法等领域,势必会引起恶劣的影响。因此,数字图像取证引起了研究人员的广泛关注。图像彩
三维人脸的有效表示以及重建在计算机视觉和图形学有着广泛的应用。三维人脸的表示,即是通过一定的算法得到三维人脸的高维特征数据,重建就是从高维特征数据中能够通过算法模型重建出对应的三维人脸。大多数存在的线性表示算法并不能有效的重建出高质量的三维人脸数据,尤其是对于面部细节的处理比较粗糙,而最新的非线性表示方法不太适用于实际三维形状。三维人脸的表示和重建能够给人脸识别、机器情感表达等方向提供该技术支持,
深度学习技术在近些年来发展迅速,而使用深度学习技术开发的系统在各个领域被广泛应用并表现出优秀的能力。但是深度学习系统中可能存在一些缺陷,这些缺陷会使深度学习系统在某些输入下作出错误决策,导致严重后果。因此,深度学习系统的测试受到越来越多的关注。深度学习系统可被分为深度学习模型和深度学习库两部分,目前大部分深度学习测试的研究针对的是深度学习模型,很少有研究针对深度学习库进行测试。由于深度学习库被众多
近年来,深度神经网络取得了突破性的进展,如今在生活中的各个领域都得到了广泛的应用,比如图像分类识别、人脸识别、语音识别等。随着对网络结构和损失函数的不断优化,深度神经网络显著的改善了各种复杂的分类任务的性能。损失函数是深度学习中不可或缺的一部分,而对于不同的任务,有各种各样的损失函数,如MSE,BCE等。关于损失函数的性能有很多研究。一个好的损失函数理论上应该能够使得数据集中相同类别的特征的分布更
基于竞争抑制免疫层析原理,开展茶叶中草甘膦快速检测试纸条的研制。采用柠檬酸三钠还原氯金酸制备了20 nm胶体金颗粒,然后以胶体金为标记物制备草甘膦单克隆抗体-胶体金偶联物,以硝酸纤维素膜为固相载体,包被草甘膦半抗原-卵清蛋白偶联物为检测线、羊抗兔二抗为质控线,建立草甘膦的胶体金快速检测试纸条。同时优化了胶体金最适pH值、抗体最佳使用量、试纸条材料的型号,最终确定胶体金溶液的pH值为7.5,最佳抗体
运动目标的检测也就是人们常说的追踪问题,它是计算机视觉的重要组成部分。其相关的方法有很多种,其中光流法描述的是图像中像素点灰度值的变化趋势,也就是像素点的运动速度矢量场。在过去的几年中,深度学习在计算机视觉和自然语言处理等各种问题上都取得了很好的效果。而随着卷积神经网络的理论逐渐成熟,其相关研究逐渐深入到光流特征图评估的领域。本文提出了一种称为快速光流单元的网络子结构,它使原网络能够通过一种快速并