基于哈希学习的近重复视频检索研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:lqlq2323
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联网的高速发展使得人们的生活变得越来越丰富,现代人分享生活的方式也逐渐多样化,从最早文字记录生活的方式,后来的图片,到如今视频已经成为我们最常用的分享途径,这同时也导致网上充斥着大量的近重复视频,海量的近重复视频所带来了许多问题,诸如用户搜索视频体验不佳、部分视频版权得不到保护、视频推荐不够准确等,这也给近重复视频检索技术带来了新的挑战。近些年来,哈希学习的技术逐渐被用来解决大规模近重复视频检索问题,哈希学习是指通过一些机器学习算法把数据压缩为二进制码的形式,在节省存储和通信开销的同时大大加快检索速度,在大规模视频内容检索领域十分适用。视频哈希学习的目标是把视频表示为二进制哈希码序列,使得原始视频数据库中的视频数据尽量保持原有的临近关系,即原本相似视频的哈希码尽量相似,非相似的视频对应的哈希码尽量不同。有效的哈希表示结果能够使得我们能够在非常有限的硬件资源下完成高效的计算,同时保证准确率。因此,哈希学习方案能够有效的解决上述大数据环境下的近重复视频检索问题,哈希学习方法也具有极大的研究价值。利用哈希学习的近重复视频的检索过程一般可以分为三个步:第一步,对原始视频提取关键帧,并从中提取特征(可提取多种类型的特征);第二步,利用哈希学习方法将每个视频所对应的多个特征融合并表示为一个实数向量;第三步,把得到的实数向量进行量化得到二进制哈希码作为一个视频的最后表示,并利用哈希码进行检索。其中,特征选择与提取在前两步中十分重要,好的特征对整个哈希学习过程将起到决定性作用,同时,特征的不足也将直接在检索结果中得到反应。其次,第三步中把得到的实数向量进行量化得到哈希码的过程也十分重要,量化的过程会涉及到信息损失,现有的方法对这一步的处理通常相对简单,例如直接选定一个阈值,阈值两侧的数值分别量化为0和1,这样的做法必然会造成过多的信息损失,从而影响最终的检索效果。我们的工作主要集中在第一步和第二步,目前的绝大多数方法仅仅提取了低层的视觉特征作为哈希学习的输入,然而与高层特征的方法相比,低层特征往往缺乏更丰富的语义内容,对原始视频的表示往往不够准确。针对这个问题,在这篇文章中,我们从特定的卷积神经网络中提取了中间层深度特征以及高级语义特征,另外,我们也提取了两种手工定义的低层特征,为了能够把这些不同层次的特征进行融合进而实现效果更好的近重复视频检索,我们利用了一种基于层次特征融合的哈希学习方法来全面的利用高低层特征的语义互补性,该方法通过联合学习多特征的特定线性变换,以非成对的方式寻求多个特征的单一判别式公共空间,最后,方法通过广义特征值的思想求解多重线性变换。实验结果表明,本方法与现有的方法相比能实现更好的效果,在使用更短的哈希码的同时达到更高的检索精度。
其他文献
以赤藓糖醇为原料,利用绿色硝化剂五氧化二氮(N2O5)在硝酸(HNO3)介质中硝解制得1,2,3,4-丁四醇四硝酸酯(ETN)。与现有混酸法相比,该反应可在无硫酸(H2SO4)环境下进行,后处理简单,废酸
李渔的生活美学有两个重要的背景,一是晚明时期追求个体感性的思潮对封建的反叛;一是戏曲这种新的文艺现象的繁荣、发达,它们都指向社会大众的世俗生活.李渔的生活美学包括衣
高职院校在倡导"工匠精神"的过程中主要有以下几个途径:推进人才培养模式的根本改革,寻找现有课程和专业培养中的"工匠精神"资源,通过实践让学生进一步了解"工匠精神",形成具
目的:评价采用中医“从咽论治”治疗IgA肾病的临床效果。方法选取2013年3月-2014年9月该院就诊的98例IgA肾病患者,采用随机数字表法将患者均分为参照组(常规治疗)和治疗组(常规治
<正>帕金森病(Parkinson’s disease,PD)是中老年人常见的一种运动障碍疾病,发病率在神经系统退行性疾病中居第2位[1]。本病具有较强的致残性,至今尚无根治的方法。目前对PD
本文以一个木里藏族村落为例,采用人类学方法调查了社区生态旅游发展的背景、历史、方式与内容,分析了主要利益相关者的矛盾及社区生态旅游发展的特点,以此来探讨藏东生态旅
目的:探讨乳腺癌患者在各个阶段的心理特点,以针对性地提出相应的护理措施。方法:通过总结对63例乳腺癌患者的临床护理资料,分析乳腺癌患者不同阶段心理特点及护理措施。结果:经过
<正>【还记得在三五年前,当我们提问香港著名电影人文隽"港片已死"这个问题时他的激动与述说,然而就在刚刚过去的2015年,与440亿内地票房相对应的,恰恰是香港电影面对内地市
期刊
介观系统是尺度介于宏观和微观之间的系统。狭义上的介观体系是指尺度很小,以至于系统中的电子运动呈现出了量子力学特性的体系;而广义上的介观体系则包括原子、分子团、纳米
过去,聚四氟乙烯管材行业挤出机都采用人工上料的方式,效率较低,容易扬尘污染,随着聚四氟乙烯管材生产和应用需求地扩大,人工上料方式带来的问题日益突出,针对这些问题,已研