基于流形嵌入的双流卷积神经网络视频语义概念分析

来源 :江苏大学 | 被引量 : 0次 | 上传用户:lovepengchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术的发展、智慧城市建设的深入、可携带智能终端设备的推广,视频逐渐成为日常生活中不可或缺的数据载体。视频数量的日益增长,复杂多样的视频内容给视频的检索、分析、存储带来巨大的压力。这般海量,庞杂多样的视频数据推动了人们从数据语义层面分析数据,并建立视频数据语义概念标签,从而实现快速有效的视频检索和管理方法。因此,研究如何有效地提取视频特征并实现视频语义概念分析检测成为视频监管和检索领域的热点问题。在查阅了大量国内外相关论文后,本文首先介绍了视频语义概念分析的研究背景、意义以及国内外研究现状;其次,简述了几种基于深度学习方法的视频语义概念分析模型和典型应用;最后,本文分析现有研究中存在的不足之处提出流形嵌入卷积神经网络模型、基于流形嵌入和光流注意力双流卷积神经网络(Two-stream CNN)视频语义概念分析模型,为验证所提模型的可用性,设计开发了视频语义概念检测原型系统。本文的主要研究工作如下:(1)提出了基于流形嵌入卷积神经网络图像特征学习方法。传统的图像、视频特征学习在构建卷积神经网络模型过程中缺乏对图像近邻关系与关联特征的学习,并且卷积神经网络训练过程中存在内部协变量位移,收敛速度较慢,训练困难等问题。本文提出了流形嵌入卷积神经网络图像特征学习方法,该方法为卷积神经网络引入流形约束,将上一层的流形嵌入到下一层的卷积运算中,使卷积神经网络的每一层都能有效保持上一层的流形结构,从而获得能够反映图像近邻关系与关联特征的视频图像特征表达。将该方法应用于图像分类,实验结果表明,该方法能够更有效地提取图像特征,从而提高特征分类的准确性。(2)提出了基于流形嵌入和光流注意力双流CNN的视频语义概念检测方法。考虑到视频空间流特征和光流特征之间有很强的互补性,本文提出了基于流形嵌入和光流注意力双流CNN视频语义概念检测方法。该方法对双流网络进行特征融合建模,通过将流形嵌入空间流卷积神经网络中挖掘特征之间的近邻关系和关联信息,引入从时间流网络到空间流网络的光流注意力层,引导空间流更多关注人体前景区域,并减少背景噪声的影响,从而较好地获得时空特征之间的变化和差异,再将双流CNN获取的特征按照时间顺序输入LSTM中学习时序特征,最后对两流的分类器结果进行置信融合,更有效提高特征学习的可鉴别性和视频语义概念检测的准确性。(3)采用面向对象软件开发方法,使用Python、PyQt等库包设计实现基于流形嵌入和光流注意力双流CNN视频语义概念检测原型系统。该系统有三个子模块分别为:视频数据预处理、模型训练、视频语义概念检测。系统提供了简洁的可视化界面,用户操作方便易上手,功能模块设计完整,具有良好的交互性和可用性。
其他文献
工业自动化技术作为一门集机械、电子、计算机视觉于一体的综合性技术,在近几年受到了广泛的关注并迅速发展。图像分类是工业自动化领域一项具有挑战性的任务,并且有很大的应用潜力。传统的图像分类方法利用各种特征提取算法提取特征,通过分析不同图像之间的特征相似性来确定标签。随着图像处理和深度学习的快速发展,许多基于神经网络的图像分类算法相继被提出,这些算法的效果在一些大型的开放数据集上得到了充分的验证,但是仍
镍基高温合金材料具有强度高、耐热性好、抗腐蚀能力强等优点,被广泛运用于航空航天领域,但由于其难加工性,使用传统外部浇注式冷却加工时刀具易磨损,工件表面加工质量难以保
随着空间探测、空间攻防等领域在国内的兴起,空间服务航天器对目标航天器的观测与在轨服务等相关技术得到重视,而对非合作目标所携带载荷的辨识,与非合作目标相对位姿测量,将
随着集成电路制造工艺水平的不断提高,CMOS器件的尺寸越来越小。特征尺寸的持续性减小给电路带来一系列不可避免的问题,如较大的漏电流、高功耗密度以及互连线的寄生效应等现
当前,我国能源需求与供给之间的压力不断上涨,能源消耗与环境保护之间的矛盾也日趋尖锐,已经成为严重制约我国经济平稳、健康发展的重要瓶颈。我国是资源相对匮乏的国家,在能
葡萄籽油是一种重要的食用、保健资源,在利益的驱使下,市场上的葡萄籽油中往往掺有其它廉价植物油,甚至地沟油,掺假的葡萄籽油将严重影响消费者身体健康和食用油产业健康。研究一种快速、高灵敏度的动态葡萄籽油分析技术对油脂企业品质监管,保障消费者权益具有重要意义。近红外光谱技术是近年来发展起来的一种绿色、快速、无损的检测技术,通过建立物质的近红外特征吸收峰与样品成分含量、成分性质之间的关系模型,可实现化学成
本文以南宁轨道交通3号线青秀山站复杂隧道群暗挖施工为依托,运用大型有限元软件MIDAS/GTS NX建立了车站整体模型,对车站站厅与下方行车主隧道之间的附属隧道群施工进行了施工模拟。通过数值模型的计算结果,得到了斜扶梯隧道的施工对于围岩的主要影响范围为隧道上方到站厅之间的区域,由于隧道走向的原因,对于围岩的扰动是持续性的。对比了CD法、CRD法以及台阶法三种施工方法,对于隧道自身结构来说,不同开挖
薄膜晶体管(Thin-Film Transistor,TFT)是液晶显示器和有源矩阵有机发光二极管显示器面板上成千上万个像素点的核心控制单元。相比于非晶硅和低温多晶硅,InGaZnO(IGZO)材料具有可
在光学领域,表面等离激元(Surface Plasmon Polariton,SPP)由于其独特表面波模式,受到了广泛的关注和深入的研究,并且在很多领域都得到了应用。人工表面等离激元(Spoof Surfa
针对马钢CSP生产线卷取过程中产生的卷形缺陷,分别从工艺、设备和模型控制方面分析卷形缺陷产生的原因;详细描述了头部塔形、交错、尾部溢出和松卷常见卷形缺陷的实物形貌.并