基于多特征融合的视频分类方法研究

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:f117f117f117677
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和多媒体技术的飞速发展,人们获取和存储数字视频变得更加容易。近些年来互联网的飞速发展,使得数字视频的传播也变得更加便捷,数字视频慢慢成为互联网用户交流和分享信息的主要途径。数字视频数量的飞速增加,使人们整理和分类数据工作面临巨大的挑战,传统人工标注和分类的方法显然已经无法满足视频增长的需求。视频的自动分类技术作为计算机视觉一个重要的分支,已经成为目前热门的研究课题。视频数据相对于文字、图像等静态信息,其内部信息的组成结构相对复杂,传统计算机视觉中研究人员手工设计的特征无法有效地提取到其中关键的动作信息。随着深度学习技术在图像领域的飞速发展,利用深度学习技术提取视频中关键的特征信息成为目前视频分类的主要特征提取方法。本文依托深度学习模型来提取视频中的关键特征信息,围绕着深度特征融合的视频分类方法进行研究。针对二维卷积神经网络和三维卷积神经网络提取的深度特征,本文提出了两种视频分类的方法。针对三维卷积神经网络提取的动作特征,提出了多时间尺度特征融合的视频分类方法,使得特征能够覆盖不同类型动作信息,从而提高特征多样性。在特征编码过程中,本文提出新的特征编码方法将定长图像序列的特征转换为整个视频的特征。针对二维和三维卷积神经网络提取的特征,提出了注意力多特征融合的视频分类方法。该算法利用长短时记忆单元中的上下文特征信息,通过注意力机制对二维卷积神经网络提取的视频帧语义特征进行修正,从而过滤背景等干扰信息,提高算法识别率。在特征融合过程中,提出自学习的加权融合策略,通过神经网络训练得到不同特征的权重系数,从而充分利用特征间关系,提升分类性能。为验证提出的视频分类方法的有效性,本文在公开数据集UCF101上进行了大量的验证和对比实验。实验结果表明,本文提出的视频分类方法可以有效地解决目前一些方法已存在的问题,从而得到较好的分类效果。
其他文献
洋流是海洋中重要的物理现象,对气候和天气等多种变化过程起着制约性作用。研究并发展GIS大场景环境下的海流可视化技术和方法,对于了解和分析海流特征和规律,从而辅助建设海洋工程、提高管理海洋的能力和水平等方面,具有重要的现实意义和利用价值。传统的静态流场可视化方法存在有诸如无法表达流场连续性、可视化效果杂乱、计算耗时等多种问题,很难保证流场快速直观地可视化,而粒子系统等动态表达方法也不适用于流场某一时
电磁场在电解质溶液中产生的电磁力可以控制流体的流动。将其用于钝体的绕流和涡生振荡时,可以消除尾涡、减少升阻力的振动进而抑制钝体的振动。本文从计算和实验两个方面对
网络虚拟化作为未来网络的基本特征之一,将网络服务提供与基础设施提供两个功能分开,依据用户业务需求提供合适的网络服务。其核心问题之一是虚拟网络映射问题,即为带有节点
网络中心性表征了企业在组织网络中的地位,能够影响到企业的资源获取和学习并进一步影响企业的决策和运营。本文基于A股2009-2016年上市高科技企业2650个面板数据,检验了网络
学位
社会经济发展越来越快,人们对商业寿险的需求也越来越大,作为中国寿险市场发展水平最高的江苏省,其寿险市场规模自2002年以来一直位居首位,此后江苏省人身保费收入规模持续增
草原生态恶化现象是当今世界各国都面临的最大生态环境问题之一,也是我国生态环境问题主要表现形式之一。为了提升生态系统质量和稳定性,党的十九大报告对草原生态保护提出了
互联网的高速发展,应用的增多导致了网络需求呈现爆发式增长,给传统的网络带来了巨大的挑战。软件定义网络(Software Defined Network,SDN)应运而生,其数据层面与控制层面分
角点作为图像重要的特征,在图像特征提取中占有重要的地位。彩色图像包含了丰富的信息,同时彩色信息的多样化使得彩色图像处理更加复杂。因此研究高精度的且能实时处理的彩色
随着用户普及率的逐年升高,基于TCP/IP的互联网取得了巨大成功,已经成为现代化社会最重要的基础设施之一。但是随着用户规模和内容资源的爆炸式增长,越来越多的终端和服务被