面向嵌入式设备的神经网络量化与容器部署

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zyllovezk1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能家居、智能安防、自动驾驶等领域的快速发展,工程上迫切需要将深度神经网络部署到各种嵌入式设备中,如冰箱、电视、摄像头、车载电脑等等。然而,目前嵌入式设备部署应用深度神经网络面临着模型参数量大、设备环境复杂等困难。因此,本文针对嵌入式设备部署应用深度神经网络所面临的问题展开了具体研究。首先,针对深度神经网络难以在资源受限的嵌入式设备上高效存储和运行的问题,本文以网络量化为基础,提出了基于标量量化和乘积量化的融合量化算法,实现了神经网络的压缩和加速。其次,针对实际应用场景中量化算法无法获取原始数据以校正量化误差的问题,提出了基于合成数据的融合量化算法,实现了无数据量化,摆脱了对原始数据的依赖。最后,针对嵌入式设备系统环境复杂,模型部署困难等问题,提出了基于轻量级容器的模型部署框架,实现了神经网络的大规模部署。具体内容如下:1.提出基于标量量化和乘积量化的融合量化算法。算法利用标量量化将乘积量化得到的映射码本的元素值转换为8位整型数。再配合8位整型的激活值,实现神经网络的定点运算,达到计算加速的目的。为了消除由不同输入引起的激活值分布误差,利用饱和截断法缩小激活值的量化区间,实现激活值的8位标量量化。最后向神经网络插入伪量单元,引入标量量化误差,通过反向传播更新参数并消除误差。融合量化算法充分结合了标量量化与乘积量化的优势,能在显著减小模型体积的同时降低网络运算量。2.提出基于合成数据的融合量化算法。基于批归一化(Batch Normalization)的移动均值和移动方差包含内部激活值的统计特征这一认识,通过最小化激活值的均值方差与移动均值方差的误差平方和,近似预训练模型中激活值的统计特征,产生合成数据。接着融合量化算法利用合成数据获取网络各层激活值和反向传播时的梯度,完成截断阈值的计算和映射码本的微调,实现无数据量化。3.提出基于轻量级容器的模型部署框架。利用容器良好的隔离性、可复制性等特点,能有效解决传统部署方案存在的严重依赖设备环境、存在大量重复工作、模型升级困难等问题。部署框架采用C/S架构模型,具体分为前端界面、服务端和终端设备。服务端包含后台管理、模型量化、镜像制作以及网络通信等功能。终端设备运行容器引擎和Agent管理程序,在容器内执行神经网络的推理计算。最后,对Docker进行了轻量化改造,改造后的容器大小减小了5倍,运行效率提升了3倍。
其他文献
仿人机器人由于其结构复杂、自由度高、以及本身不稳定和易受扰动等特点,对快速稳定的行走控制带来了极大挑战。在仿人机器人运动控制研究中,快速运动所带来的系统非线性问题显得尤为突出,对机器人建模及控制算法提出了更高的要求,因此运动速度成为了衡量仿人机器人性能的重要指标之一。本文针对仿人机器人的快速动态步行运动开展研究,设计了基于模型预测控制的仿人机器人动态步行控制算法,在此基础上对仿人机器人的速度提升方
学位
先天性特发性眼球震颤(congenital idiopathic nystagmus,CIN)是临床上最常见的儿童眼球震颤类型,发病率约1/3700。其主要表现为眼球震颤引起的视功能障碍和患病儿童为减轻震颤而采用的异常观察头位。患儿固定的异常头位被称为代偿头位。临床上比较有效的治疗方法是通过眼外肌的断腱重缝将代偿头位下的观察中间带移至正视头位下。因此定量、准确地测量患儿代偿头位及眼球震颤强度对该疾
学位
具有环境顺服性的柔性机械臂的控制问题是目前人机协作领域中需要的解决的重要问题之一,近年来引起了众多国内外研究学者的关注。本文在此背景下,结合生物中小脑的自适应学习、预测控制的作用,研究了基于小脑模型的柔性机械臂控制方法。围绕多自由度柔性关节机械臂的仿生控制、软驱动器驱动的仿生机械臂系统建模与控制以及基于脉冲特性的仿小脑控制方法这三个方面进行了研究。主要研究内容如下:1.针对多自由度柔性关节机械臂的
学位
随着高校信息化建设的发展以及教育部对构建智能化教学支持环境的号召,传统多媒体教室渐渐不能适应教学改革的需求和教育信息化发展的方向,越来越多的高校开启创新之路,智慧教室作为信息技术与教育深度融合的产物应时而生。在此背景之下,国内众多高校纷纷开始建设智慧教室来探索教学模式和教学方法的变革,以此来满足信息时代背景下对智慧教育的迫切需求,北京作为我国的首都和教育中心更应走在前列。有研究表明,由于缺少指导性
学位
路面裂缝是道路病害的重要表示形式之一,也是许多其他病害的早期形式。中国每年在裂缝检测和维护上投入了大量的人力和物力,路面裂缝的自动检测可以极大地降低养护成本。目前使用激光、雷达等相关技术的检测方法已经相对成熟,但由于设备昂贵,仅适用于桥梁等特殊路面,难以规模化应用。而随着计算机视觉领域的快速发展,基于深度学习的路面裂缝检测也取得了一定的成果,但在实际应用时,检测性能仍有一定的提升空间。本文针对路面
学位
钢铁作为基础的原材料,是现代生活不可缺少的必需品,高炉炼铁作为大型炼铁系统中关键工序,其运行的稳定性决定了整个炼铁系统的运转效率和质量,因此快速准确地对高炉故障进行检测和识别对于高炉乃至整个炼铁系统稳定运行有着重要意义。高炉本身作为一个复杂的大型系统,其准确的机理模型难以建立。数据驱动的高炉故障诊断方法由于不需要准确的过程机理模型,而得到了广泛的使用。有别于高炉故障检测方法,有监督的高炉故障分类算
学位
随着国内港口集装箱吞吐量的不断增长,提升集装箱码头整体工作效率的需求日益迫切。集卡和场桥作为集装码头水平运输和堆场作业的主要设备,通过智能调度策略弥补人工调度策略存在的不足,提高作业设备的工作效率,对集装箱码头发展具有巨大的现实意义。本文以国内某大型集装箱码头集卡和场桥的调度情况为研究背景,对各个调度子系统和系统之间的耦合性进行详尽分析,设计了基于动态分杆的集卡与场桥联合调度方案,并通过仿真验证方
学位
火电机组因煤炭存储量大、技术要求低、基础设施完备等原因一直是我国电能产生的主体,煤炭燃烧不可避免地产生有害气体,其中,氮氧化物(NOx)是火电机组烟气中主要污染气体之一。近些年,随着环保意识的提升与排放政策的收紧,基于选择性催化还原(SCR)的脱硝技术被广泛使用于火力发电厂,SCR脱硝系统的控制优化也成为了研究热点。SCR系统入口氮氧化物浓度是脱硝控制的重要输入量,但是由于检测系统固有的分析时延,
学位
癫痫是由脑部神经元异常同步化放电所导致,以突发性、重复性和短暂性为临床特点,是一种常见的神经系统疾病。脑电图可以反映大脑内部的状态,利用脑电预测癫痫发作问题是癫痫检测的常用手段,另外随着计算机技术的发展,通过深度学习的癫痫发作自动检测研究越来越成为癫痫临床研究领域的热点问题。长短期记忆网络(Long Short-Term Memory,LSTM)是一种时间循环神经网络,它是为了解决循环神经网络(R
学位
带有目标追踪功能的移动机器人在未来的安防、军事等领域将会有着广泛的应用。球形机器人是一种外壳为球形的特殊机器人,在其内部封装有运动部件和部分传感器,通过重心偏移等原理,可以全密封、高速、稳定地运动,对复杂环境适应性强。球形机器人低视角,外壳遮挡,背光等原因会导致传感器数据质量不高,且计算资源存在限制,对感知算法的性能提出了更高的要求;其滚动的运动方式,需要适配专门的运动控制算法来进行轨迹规划与跟踪
学位