基于混合CNN的视频分类方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:jamesshen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和多媒体技术的飞速发展,每天有海量的视频产生并上传到各大直播平台,如何让机器理解这类海量的多媒体内容,以此提升这些视频的智能分发效果及效率是各大直播平台面临的重要问题,视频分类是视觉理解技术中的重要组成部分,因此如何实现对视频进行精确且高效的分类是本文研究的主要内容。
  视频作为多媒体内容的重要组成部分,相比多媒体中的文本和音频等信息而言包含的内容更加丰富,因此本文主要以视频作为研究对象,使用视频解码后的图像作为我们分类方法的输入特征来实现对视频内容的自动分类。本文的研究工作主要集中在构建高效且精确的视频分类方法来提高视频分类系统的性能,具体的研究工作如下:
  (1)针对视频分类现有混合卷积神经网络(2DCNN+3DCNN)架构ECO在底层2D网络进行外观特征提取时,易受不相关背景的影响,并且在高层3D网络学习时间表示时只关注局部时间窗内的动态,没有考虑动作的长期时间结构等问题,提出了一种将通道空间注意力和非局部感受野引入到混合CNN架构中的视频分类方法(CS-NL-ECO)。首先在已有混合架构中的底层2D网络引入通道和空间注意力(CS),通过学习自动获取每个特征通道的权重,依照权重关注重要的特征而抑制不相关的背景。其次在高层3D网络中引入非局部模块(NL),学习非局部时空特征表示自动捕获长范围的时空特征依赖关系。最后在UCF101、HMDB51、Kinetics以及Something-something这四个视频分类常用的公有数据集上进行了实验,结果表明该方法在精度上优于原方法,并且整体性能优于一些视频分类的方法。
  (2)针对CS-NL-ECO方法中的三维ResNet网络中时空卷积核和大输入、输出张量导致的额外的计算成本等问题,研究了引入时空卷积核分解和多纤维单元结构改进计算效率的方法,并探索了时空卷积核分解能否对多纤维单元方法做进一步的优化,提出了一种基于多纤维单元结构的高效视频分类方法(CS-NL-MFECO),通过在3DResNet网络中嵌入多纤维单元结构,进一步增强网络的时空特征表示能力,提高网络计算效率,同时保证视频分类的准确性。实验结果表明将多纤维单元引入到混合架构的CS-NL-MFECO方法取得了更好的计算效率,整体性能达到了最新方法的基准。
  (3)本文将所研究的方法应用于音视频编解码服务器中的在线视频分类模块中,根据需求设计了一套合理的在线视频分类流程,并且针对在线场景进行了功能展示,并对实验结果进行分析。
其他文献
近年来世界各国对临近空间产生了极大的兴趣,临近空间技术得到了迅猛发展。直接序列扩频(DSSS)技术以其良好的抗干扰、抗截获能力在临近空间高动态飞行载体的测控与信息传输系统中展现了巨大的应用前景。临近空间飞行载体所具有的高动态低信噪比的环境特性给高效可靠的扩频接收机设计带来了新的挑战。扩频接收机的关键在于实现对扩频信号的正确解扩,而解扩操作的前提首先要实现接收信号与本地信号载波频率的近似估计和伪码(
临近空间高超声速飞行器所具有的“长时间、高机动、高存活率和高超声速等特点”,使其成为极其适合的的雷达搭载平台。然而,高超声速飞行器在飞行过程中与空气剧烈摩擦,形成等离子鞘套。当高超声速飞行器载雷达进行应用时,特别是进行目标探测时,必须要考虑等离子鞘套对高超声速飞行器载雷达目标探测的影响。雷达信号在等离子鞘套中的传输特性的研究是等离子鞘套下高超声速飞行器载雷达应用的前提与基础。等离子鞘套会对雷达信号
学位
合成孔径雷达(Synthetic Aperture Radar,SAR)能够对感兴趣的观测区域进行高分辨成像,其不受天时和天候的影响,广泛的在军事和民用领域中应用。随着SAR用户对运动目标信息获取需求的增长,地面运动目标指示已经成为SAR系统的一项重要功能,可以进一步提升SAR系统的运动目标信息感知能力。然而,由于探测环境的日益复杂,场景中必然将大量出现快速机动目标,如:道路上飞驰的车辆、战场上高
射频无线能量传输(Radio Frequency Wireless Energy Transfer,RF WET)技术为解决未来通信网络(如物联网)中能量短缺问题的核心技术之一,其核心思想是利用射频信号既可以传递信息又可以承载能量这一双重特性,通过从射频信号中获取能量,从而实现为能量受限节点无线供能。另外,为了满足通信网络的高频谱效率、高能量效率需求,各类高效的无线通信网络架构竞相涌现,如多天线通
有限势博弈作为一类特殊的博弈具有许多优良的性质,特别是纯纳什均衡的存在性和演化下纳什均衡的可达性这两个特性,使它备受青睐.势博弈在博弈理论中占据着非常重要的位置,尤其是在近几年发展的博弈控制论中,作为支付设计和学习规则设计这两个步骤的接口,在分布式系统的优化与控制问题中起着非常关键的作用.本文主要利用势博弈的静态和动态性质,借助矩阵的半张量积这一数学工具,一方面将设备系统等价转化为有限势博弈,从而
学位
浮游生物不仅为海洋哺乳动物和商业上重要的鱼类提供食物,而且通过提供一半的全球初级生产力和对生物地球化学循环做出重大贡献,在海洋生态系统的功能中发挥着根本作用。因此,海洋浮游生物群落结构的变化是一个值得关注的问题。生物上,通过观测海洋测量数据和实验现象发现浮游生物的群落结构受到多种因素的影响。数学建模是分析外在环境变化和内在生理变化对浮游生物生物量影响的一个重要理论方法。通过对浮游生物建立恰当的数学
离群点检测作为数据挖掘技术下的一个重要子项,被广泛应用于网络入侵检测、工业系统故障检测、智能家居系统及医疗诊断等领域。随着数据在规模和维度上的双重增长,如何在大规模多维数据集中准确高效地检测离群点成为一个非常关键且极具挑战性的课题。目前,常用的检测算法如孤立森林(Isolation Forest,iForest)、局部离群因子(Local Outlier Factor,LOF)等由于算法本身的局限
虚拟机迁移作为有效的管理手段被广泛应用于云数据中心,特别是动态迁移技术,其在硬件维护、负载均衡、服务器整合、能耗优化和跨站管理等方面发挥了极其重要的作用。而相关研究中大多都积极地致力于通过虚拟机整合来降低数据中心的能耗,忽略了保证用户服务质量的迁移因子,特别是用户访问虚拟机服务时的访问延迟。访问延迟是现代跨地理区域服务的云数据中心内衡量云服务质量的重要指标,会直接影响到云服务商的市场拓展。因此本文
差分隐私保护下的分类算法一直是信息安全领域中备受关注的研究方向,可以在保护数据隐私的情况下对数据进行分类预测,因此在推荐系统、运输信息保护等方面有着重要的应用。但是差分隐私带来隐私保护的同时会严重影响算法的分类预测效果。因此本文围绕差分隐私下的决策树算法和随机森林算法展开了研究,立足于保护数据隐私性的前提下,提高算法的分类准确率。首先,针对差分隐私决策树算法在低隐私预算下生成噪声量过大的问题,在决
学位
现代战术任务有着复杂的通信和计算需求,战术网络使用无线电台、便携式通信设备等,通过传输数据、控制命令,来完成数据收集、指挥控制等功能。随着战术网络复杂性的增加和联合作战的需求,传统的战术网络架构已难以满足需求,并饱受复杂的配置和过大的协议开销等问题。软件定义网络(SDN)作为一个新兴的,有广阔前景的思想,旨在对通信网络的架构和运行方式进行革命性的改变。但是针对资源及其管理都是分布式的战术网络,如何