基于深度自编码器的近重复视频检索

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:tony_tang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为互联网时代的一种重要信息载体,视频数据在人们生活中发挥着越来越大的作用。近些年,互联网上出现了大量的近重复视频,冗余的视频给视频的管理带来了不便。如何快速精确地检测出这些近重复视频成为研究的热点。基于内容的近重复视频检索,其过程可以分为三个部分:关键帧提取、特征提取和特征匹配。在特征提取部分,目前的方法多是使用图像的视觉特征或是局部特征,特征维度一般较高,特征表征能力较弱,导致检索性能较弱。近些年,深度学习的研究获得了重大突破,很多传统方法能解决的问题,利用深度学习都取得了更好的效果。在图像处理领域,深度神经网络可以自动提取图像中更抽象的隐藏的特征,然后利用这些特征完成图像的识别或分类。但是,基于深度神经网络的方法在视频检索中并没有得到广泛的应用。基于此,本文做了以下研究工作:1.提出了一种基于镜头的自适应关键帧提取算法。该方法先把图像切分成许多块并求图像的颜色直方图,通过加权求和方式计算帧间差,然后计算当前帧和帧集合中帧间差平均值的差值,将该差值与阈值作比较来判断当前帧是否是镜头边界帧。实验结果表明该方法能比较好地提取关键帧。2.提出了一种基于深度自编码器的近重复视频检索方法。该方法利用深度自编码器神经网络从关键帧中提取特征,为了比较该方法与基于其它图像特征的方法的效果,在标准近重复视频检索数据集上进行了实验。实验结果表明,本文提出的近重复视频检索方法的效果要优于基于图像颜色特征和LBP特征的方法。
其他文献
近年来,随着经济全球化的加剧,科技文献翻译引起了越来越多人的注意,尤其是石油工程英语的翻译。石油工程英语属于专门用途英语(ESP)的范畴,同时也是科技英语(EST)的一个分支
本文为期刊论文Cost Analysis of Oil,Gas,and Geothermal Well Drilling(石油、天然气和地热井钻探的成本分析)英译中翻译实践报告。本篇翻译实践报告以纽马克的交际翻译理
关联成像,又称为鬼成像,是一种非定域光学成像技术。光源发出具有空间关联的两束光,分别使其通过两个不同的光学路径:待成像物体放置在其中某一光路上,即物臂,物体的透射或反
随着无线传感器网络和智能设备的发展,基于位置的服务在人们的现实生活中正起着愈发重要的作用,其在出行导航、安防搜救和居家照护等领域得到了广泛的应用。如何准确地获得目
20世纪80年代我国民营医院逐渐出现在公众视野,早期表现为民间资本或个人资本两种出资形式,主要成立的是专科医院或门诊部,实力相对较小。2001年我国医疗市场逐渐放开,并出台了一系列的开放政策,使得大量资本进入医疗领域,民营医院得到了飞速发展。口腔医疗行业有其投入低、产出快、医疗风险小等特点,使口腔医疗行业成为了民间资本进入医疗行业的首选专业。至2010年后其竞争尤为激烈,原有的管理观念已经不能适应
漳平元沙钼矿床位于闽西南拗陷带的中段东侧,大地构造位置上位于华夏地块东南部,处在政和—大埔深大断裂和连江—永定断裂带的交汇部位。在早白垩世早期阶段(140Ma130Ma),由于
本文主要通过不同的原料制备了一系列的噁唑烷酮类产物。另外,研究了温和条件下二硫化碳的选择性转化。噁唑烷酮是一类重要的杂环类化合物,具有许多潜在的生物活性,而现有的
金属有机骨架(Metal-Organic Frameworks,MOFs)是通过金属离子(或者金属簇)与多齿有机配体配位而形成的多孔结晶材料。因其具有多孔结构、比表面积大且孔道易于修饰和调节等优势,
在有机合成中,铜催化的Ullmann偶联反应是构筑碳-碳键和碳-杂键的关键方法之一。这类反应可以构建生命科学和材料科学中普遍存在的杂环骨架。本论文在绿色化学理念的指导下,
光子晶体作为一种新兴的可以调控光子的材料,在光学和光电子学领域具有着非常大的潜力与应用价值,在十几年内建立了相应的理论与制备手段,其中多孔阳极氧化铝光子晶体(NAA-PC