基于深度学习的视频内容检索算法研究

来源 :西安工业大学 | 被引量 : 0次 | 上传用户:shinetos
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的视频检索依赖人工对视频内容进行标注,通过关键词匹配的方式实现。随着视频数量的急剧增加和视频内容的多样性,人力成本大幅度提高的同时,有限的关键词无法准确的对视频内容进行描述和检索。因此,本文对视频内容检索算法进行研究,针对视频内容检索中关键算法存在的问题,结合深度学习提出改进思路并实现,为视频内容检索领域提供新的思路和方法,使其可以更好的应用于工程领域。本文主要研究内容包括图像特征提取算法研究、镜头边界检测算法研究、关键帧提取算法研究,主要贡献如下:(1)提出基于改进VGG16模型的图像显著性区域深度特征提取算法。首先,采用CAM算法对图像显著性区域进行提取;然后,对VGG16网络模型进行改进,去掉前两个全连接层,使其可以更好的保留图像空间结构信息,采用全局池化取代原来的平均池化,使其可以更好的整合图像全局信息,为保证去掉两个全连接层之后网络的性能,将最后一个卷积层中卷积核数量增加到1024,在所有卷积层后添加批标准化层,使得每层的输入具有相同的分布,从而加快网络训练速度;并选取PCA算法对提取到的特征进行降维处理;最后,经对比验证,本文算法的MAP相较于VGG16全局特征提升4.36%,相较于BOF算法提升16.99%。(2)在图像显著性区域深度特征提取算法的基础上,设计出一个高效的视频镜头边界检测框架;并对镜头边界检测算法进行研究,引入RNN网络对渐变边界进行检测;最后,经对比验证,本文算法的性能优于基于卷积神经网络的镜头边界检测算法和基于特征融合自适应双阈值的镜头边界检测算法。(3)提出一种自适应聚类关键帧提取算法。首先借助图像显著性区域深度特征对帧间相似度衡量的方式自适应计算类簇数,并借助SOFM初聚类自适应求出聚类中心;然后将自适应计算出的类簇数和聚类中心代入k-mediods进行聚类;最后,经对比验证,本文算法的性能优于传统的关键帧提取算法。论文结合上述研究,设计出了一套新的视频内容检索系统,与传统的基于文本的视频检索进行对比分析,结果表明,本文算法相较于传统方法在查全率方面平均提升16.76%,在查准率方面平均提升26.79%,证明本文算法在不需要人工标注的前提下,大幅提高了检索的准确性,在工程领域具有较好的应用价值,在学术领域具有积极的参考意义。
其他文献
目的:为药品上市许可持有人进行药品再注册和药品监管部门开展药品再注册审查审批工作提供技术参考。方法:对福建省第三轮药品再注册申报资料进行技术审查,汇总分析发现的缺陷项目,提出相应的解决措施和建议。结果:截至2021年6月,审查共发现955条缺陷,主要涉及处方工艺及质量标准、原料药来源、说明书方面的申报资料。结论:药品上市许可持有人应当准确理解药品注册法规的最新要求,完善药品上市后持续管理。建议药品
期刊
在物料运送系统中,精确定位方法作为自动引导车(AGV)能否完成货物转运的前提,具有重要研究意义。目前工业AGV定位方式主要可分为导轨定位和自主定位两种方法。然而在采用导轨定位时需耗费大量人工成本且鲁棒性差,无法快速部署使用。在采用自主定位时则又存在定位精度较差,接驳停靠间隙过大等问题。故本文以生产车间零部件转运为研究背景,以物料运输中的精确定位为研究目的,提出基于激光雷达的物料运送AGV精确定位方
学位
在经济日益增长的今天,锂电池已经在各行各业中得到了广泛应用。但锂电池在循环使用过程中受高温、隔膜老化、使用不当等因素影响,电池性能逐渐退化,间接导致用电设备性能下降并引起设备故障,造成巨大的人力物力财力损失。因此,需要对锂电池进行剩余寿命(Remaining Useful Life,RUL)预测。由于锂电池循环周期较长,难以获取较多老化数据,因此锂电池RUL预测存在小样本问题。针对小样本条件下锂电
学位
智能抓取是智能型机器人的一项重要功能,在实际的生活场景中待抓取物体种类和抓取点会经常性的发生改变,如果使用传统的方法对目标进行抓取,则需要人为不断参与抓取参数的设定,这将导致抓取智能化程度严重不足。本文针对智能抓取规则物体和非规则物体两种任务,研究了各自任务对应的抓取策略,并基于深度学习的方法预测不同任务下的抓取参数,从而可以实现对规则物体和非规则物体的智能抓取。本文主要研究的内容如下:1、研究规
学位
未来战争的需求驱使着武器装备信息化程度不断深入,常规弹药加入制导装置成为现代弹药发展的重点研究方向,这对制导核心器件及信息处理方式提出更高层次的要求。由于微机电(Micro Electro-Mechanical Systems)MEMS陀螺相对传统结构陀螺有着低成本、小体积和便于集成化等优点,在惯导等领域得到广泛应用。但由于制造工艺及使用环境等不利因素会造成误差,导致基于MEMS陀螺的导弹存在命中
学位
目的 构建新药品注册法规背景下境内药品再注册的技术审查标准。方法 通过分析药品法规和审查案例,初步确立境内药品再注册的审查要素,并采用改进德尔菲专家函询法,对33名药品注册审查专家进行2轮函询,统计分析函询结果。结果 制定了一套境内药品再注册的技术审查标准,包括8个一级要素、41个二级要素。结论 本研究构建的技术审查标准有望促进药品再注册技术审查工作的规范化,提升药品再注册技术审查质量。
期刊
多目标跟踪是利用传感器对多个运动体的特征进行估计的过程,其技术广泛应用于机器人传感系统、智能交通监控系统及雷达预警与跟踪等领域。随着无人机集群作战这一新型作战概念的提出,无人机集群机动性强、结构发生演化及密集度高等自身不确定因素,加之现代战场环境愈加复杂,探测盲区等一系列外界不确定因素,均会使得现有的目标跟踪方法无法准确地对目标-量测进行有效关联,从而严重影响了多群目标的跟踪效果。因此,针对未知杂
学位
重金属污染严重影响生态环境与人类健康,砷和铬作为典型含氧阴离子型污染物,具有高的迁移性和毒性。铁氧化物被广泛地用作水体中砷和铬的吸附剂,通过电化学反应能进一步提高铁氧化物的去除能力。在本工作中,通过Fe(NO3)3和尿素混合溶液在微波辅助水热反应下得到的纳米赤铁矿作为活性材料,采用恒流充放电和恒电位电解高效去除水体中的砷和铬,考察了赤铁矿对砷和铬的电化学去除能力和机理,并进一步考察了赤铁矿质量,电
学位
近年来,分数阶神经网络的动力学研究在各个研究领域备受关注,涌现出大量关于分数阶神经网络稳定性分析以及分数阶混沌神经网络同步控制的研究成果。即便如此,仍有诸多问题亟待研究和解决,如采用李雅普诺夫分析法研究系统稳定性时能量函数构造的保守性和局限性、分数阶系统中的时滞现象以及实现分数阶神经网络系统同步时控制器的构造问题等。本文主要研究Hopfield型分数阶神经网络,在Riemann-Liouville
学位
截止到2016年,油菜是仅次于大豆和油棕榈的世界第三大油料作物;同时,油菜是中国的主要油料作物之一。在农业机械化与现代化趋势下,全国的主要油菜种植区逐步推行油菜机械化的种植和收割。作物苗期的株数,不仅是影响作物出苗率、密度、种群竞争和最终产量的一个重要因子,还是与农艺生产实践有着密切关系的一个参数。保证油菜机械直播效果和质量的基础和关键,在于对田间油菜植株数量的无损、快速、高效、准确识别和估测。如
学位