基于3D可逆网络的视频分类研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jinke1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,互联网上图像和视频的规模日益庞大,各大视频网站每分钟就有数百小时的视频产生,这使得大规模视频分类是继图像分类问题后下一个急需解决的关键问题。近年来,传统的视频分类算法受到限制,而随着网络的不断深入和扩展性的发展,深度网络(如Reversible Residual Network、Res-Net、Google-Net、C3D、Two-stream等)极大地推动了图像、视频的分类技术的发展,性能也在不断的得到提高。但是,由于在计算反向传播的梯度之前需要保存激活,所以在有限的资源下,存储消耗出现了瓶颈,这种现象在3D网络中更为明显,严重的限制了网络的深度和宽度。本文基于2D-REVNET的思想提出了3D可逆网络3D-RevNet,并用于视频分类。3D-RevNet是3D-ResNet的变体,同样不需要保存3D残差块的激活层输出,有效提高显存利用率。在本论文中,我们讨论了对于输入输出数据按照传统的通道切割和基于视频帧切割的不同方式,由于3D-RevNet残差块的切分,基于视频帧切分的方法在捕获局部帧特征的同时挖掘视频流前后的全局帧信息关联,以此提高视频分类精度。在标准数据集(如Kinetics、UCF-101等)上进行的大量实验表明,跟现有方法相比,3D-RevNet使用Image-Net预训练的模型显著提高了显存使用率以及视频分类的精度。
其他文献
光纤温度传感器具有灵敏度高、抗电磁干扰、耐腐蚀等优点,广泛应用各个领域。光子晶体光纤的产生及发展,极大推动着光纤传感器的发展。结合光子晶体光纤无截止单模传输、大的模场面积及良好的色散等优点,极大优化了传感器结构设计。本论文主要针对几种不同的光子晶体光纤,从实验和理论上分析了光子晶体光纤温度传感特性。本论文主要工作分为以下几个部分:首先,我们分别利用双芯光子晶体光纤(TC-PCF)和保偏光子晶体光纤
由于薄壁梁结构具有高的刚度质量比,所以它被广泛地应用到各种工程中。在薄壁梁的概念设计阶段,其截面形状的设计是一个尤为重要的问题。通过传统的截面设计方法不能得到具有薄壁特征的截面,而且设计结果往往无法满足冲压工艺。为了解决上述问题,论文提出了一种采用移动可变形组件方法的截面拓扑优化方法。论文以截面面积作为拓扑优化的目标函数,以截面的弯曲惯性矩、扭转惯性矩为约束函数建立数学模型。针对欧拉-伯努利梁,给
随着我国海洋强国战略的提出,具有优良耐蚀性的钛合金成为海洋工程青睐的高端材料。然而,钛合金本身硬度相对较低、摩擦系数高、耐磨性差的缺陷限制了它的广泛应用。此外,在
自发现量子霍尔效应以来,拓扑理论一直在不断完善,特别是最近十几年,拓扑理论与实验陆续取得突破性进展,拓扑材料作为一种新的量子物态,吸引了研究者的广泛关注并迅速成为研
书院作为一种特殊形式的教育机构,它为古代教育的发展和学术的繁荣做出了重要的贡献。但近代以来,书院建设没有得到足够的重视,书院文化的积极作用没有发挥好。书院文化中的
随着信息全球化的发展,人们对消息的需求日益增加。面对有限的网络资源,如何更加快速有效的利用网络资源变得越来越重要。网络编码理论的提出,有效提高了数据的传输速率,实现了对网络资源更加有效的利用。在基于网络编码的通信系统中,信息在节点处进行编码操作,提高网络吞吐量的同时也带来了不可忽视的网络安全问题。安全性问题是网络编码走向实际应用的最大障碍之一,虽然网络编码在节点处对数据进行了混合,但是网络窃听仍然
砌筑排水沟传统的施工工艺是采用浆砌片石或浇筑混凝土两种施工方式,不仅需要提前采备砂石材料、购置水泥,安装搅拌设备,而且施工进度缓慢,后期还要进行养生,施工时占道作业,
面对全球化石燃料日益枯竭以及大规模消耗化石燃料带来的环境污染和温室效应等问题,寻找清洁可持续能源已经成为全球科学家的研究重点,其中氢能凭借燃烧热值高、清洁无污染等
2013年3月,在我国上海、安徽等地首次出现了人类感染新型的H7N9流感病毒。截止2018年1月25日,我国20多个省市地区共有1566人感染H7N9病毒,其中死亡人数为613人。自H5N1亚型高
股票型基金是我国证券投资基金的重要构成部分,自南方基金发行基金开元和国泰基金发行基金金泰两只封闭式基金以来,我国基金市场已经历近22年的发展历程。在发展过程中公募基金作为机构投资者的重要组成之一其投资策略既对市场产生影响,同时市场“行情”对基金择券择股策略也具备实时影响,2015年以来我国公募基金经理更换频率较以往有大幅上升,究其原因是否因为由于基金投资风格与市场投资风格不一致即市场偏好小盘股而基