基于张量化神经网络的视频分类

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:awards
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
短视频的制作与分享随着移动互联网的飞速发展而变得更加的便捷。目前短视频制作与分享已经进入了黄金发展时期,每天都会有无数的视频被生产和传播。然而,短视频的快速发展在给人们带来好处的同时,也给相关监管工作来了很大的挑战。如何管理这些海量视频,已成为当前面临的重大挑战。庆幸的是,视频分类技术为有效管理海量视频带来了曙光,也因此受到了越来越多的科研人员的关注。深度神经网络具备的强大拟合能力,使其不仅在越来越多的研究领域中得到应用,并且在性能效果上也取得了非常优秀的成绩。受此启发,科研人员也寄希望于使用深度神经网络来解决视频分类带来的技术难题,研究如何有效精准地识别和分类短视频。与在图像处理等领域应用中不同的是,在视频分类技术研究领域中,深度神经网络仍有大量基础的研究工作需要完成,即研究工作还不够深入,因此当前深度学习在视频分类上的应用依然面临着巨大的挑战。而且,为了获得优异的性能表现,深度学习网络往往被设置得越来越深,其参数量也因此不断暴增。这严重限制了深度神经网络。在资源有限的移动设备中的应用。为解决此问题,愈来愈多的研究者将目光投向了神经网络参数的压缩研究工作。本文的研究内容与工作如下:(1)首次提出将张量环分解方法应用于压缩原始循环神经网络和门控循环单元网络。基于张量环分解。的独特结构与循环神经网络的内部构造,本文将张量环分解方法巧妙地应用于原始循环神经网络和门控循环单元网络中,在尽量保持模型性能不变的同时,大量减少网络冗余参数。(2)提出使用基于张量环。分解的循环神经网络对视频分类技术进行研究探索。本文中的张量化神经网络不仅对输入-隐藏矩阵进行压缩,同时也对隐藏-隐藏矩阵进行压缩,从而进一步提升了对神经网络的压缩率。(3)本文将在几个主流视频数据集(即UCF11、HMDB51和UCF50)上进行实验,详细分析本文提出的张量化神经网络模型。实验结果表明,本文提出的张量化神经网络模型不仅能有效压缩神经网络,而且在视频分类中效果更好。
其他文献
现今,与人脸技术的相关研究已经有大量的工作并实现应用,其落地实现方法有依赖互联网云平台丰富的计算资源,有利用传统机器学习方法以降低计算量的,还有依靠带GPU的高端嵌入式平台的,但这些落地实现方法难以作为兼顾实时性、安全性、复杂环境适应性、低成本与低功耗方案推广。鉴于以上问题,本课题拟设计一种轻量级人脸检测、人脸关键点检测和人脸验证算法,自制数据集,并对数据集的增强操作随机使用了多种技巧,改善模型训
近年来,随着5G时代的来临,电力系统进入到了物联网时代。伴随着电力物联网规模的不断扩大,运行环境愈发复杂多变,暂态稳定性的问题也变得愈发严重。电力系统在运行期间,时常会因为某些部位发生短路而引发相关的故障,使整个系统进入到暂态运行状态,相关参数在受到干扰的情况下也会发生显著改变,进而会给系统形成较为显著的危害。所以积极探索对暂态稳定情况进行有效调控且可靠性较强的控制技术是非常有必要的,能够提升电网
密码技术在当下信息安全形势不断严峻的背景下,仍担任着非常关键的角色。目前,根据密钥的数量和使用方法的差异,密码算法主要被分成非对称密码算法和对称密码算法,前者在加解密过程中分别使用私钥和公钥,后者则使用同一种密钥。AES和SM4算法是当下主流的对称密码算法,在信息传输方面有较高的安全性。传统的密码算法大都通过软件方法来实现,这种方法占用资源较多,运算效率低,安全性也不足。而硬件方法拥有更高的运算效
光伏发电输出特性易受外部环境改变影响,具有非线性、间歇性等特点。为提高太阳能的利用率,需要对非线性的光伏输出进行最大功率点跟踪(Maximum Power Point Tracking,MPPT)控制。另外,光伏的输出电压较低,需利用高增益DC-DC升压变换器作为升压接口以实现并网。在现有的变换器技术中,单级多单元(Single-stage Multicell,SSMC)高增益DC-DC电能变换器
随着电力产业的快速发展,输电铁塔的建设已遍布全国各地,给人民的生产生活带来了极大的便利。当前国家大力推行的生态优先、绿色发展之路,不仅造福了人类,而且鸟类的栖息环境也受到有效的保护,日益增多的鸟类在输电铁塔上驻留、排便和安家等行为给配电线路的正常运行造成了巨大的威胁。针对这一问题,电网运维工作者和相关专家提出了多种解决方案,如安装防鸟刺和智能驱鸟器来防止害鸟在杆塔周边活动。这些方案虽然可以在一定程
随着科学技术的高速发展,精密工程技术所涉及的领域越来越广泛,包括微电子技术,纳米技术,精密加工技术,航空航天技术等领域,因此,国内外对系统的精密定位,控制方法以及系统稳定性等方面也提出了相对较高的要求。本文主要根据音圈电机的自动定位来实现镜头的自动对焦进行研究及分析。首先设计音圈电机的高精密微定位平台,该平台设计可以实现手动和自动两种对焦方式,可扩展性较强。应用伺服控制方式进行音圈电机驱动设计,有
当今社会,能源短缺及环境恶化问题日益严重,新型可再生清洁能源的开发已势在必行。作为一种清洁可再生能源,氢能是代替化石能源的最佳选择之一。电解水制氢作为一种绿色的制氢途径得到广泛研究,然而水分解的两个半反应——析氢反应(hydrogen evolution reaction,HER)和析氧反应(oxygen evolution reaction,OER)自身存在较高反应能垒,缓慢的动力学过程使得实际
人工智能的蓬勃发展不仅给各行各业带来了深刻的变革,相关的技术也逐渐应用到人们生活的方方面面。多智能体系统作为人工智能重要技术组成之一,也受到了学界越来越多的关注。早期相关研究多着重于单智能体路径规划,或者环境已知且场景相对简单的多智能体路径规划。现在应用场景的复杂性和多变性,对多智能体系统的决策能力和路径规划的效果有了更高的要求。即便在环境简单且已知的场景,传统方法对于路径规划的求解效率也不是很高
在当今我国经济不断发展的大环境下,城市的基础建设得到了大量的投入,更多的城市已经拥有了一套完善的地铁线路网络,带动了城市各区域的人流往来和经济互动,有效地缓解了地面交通压力。与此同时,更多的人们在选择出行的方式中倾向于地铁这种便利且快速的交通方式,但随着地铁线路网络的不断扩张以及地铁站内空间结构不断复杂化,用户在室内无法使用GPS定位服务的情况下,对地铁站内的空间布局依然处于传统指示牌引导的目测阶
本文主要考虑的问题是协作机械臂在控制过程中如何有效、灵活的进行人机协作并完成避障,因其特点,本文主要考虑的协作机械臂工作场景为协作小型货物搬运、辅助工具拾取和装配器件辅助拾取等,其具有需求精度低、灵活度高等特点。本文的目标是通过在仿真环境下的训练得到深度强化学习模型,用其代替协作机械臂控制算法的决策避障功能,取机械臂的末端位置动作为强化学习智能体的动作,取机械臂的人机交互物理信息为强化学习的环境状