基于端边协同的深度神经网络推断优化方法设计与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:jonasgu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在工业互联网环境中,深度神经网络应用已经在工业生产中被广泛使用,这些应用往往被部署于智能终端设备中,有着计算量大和数据量大的特点,且对推断时延有着较高的要求。然而,现有的智能终端设备性能较弱,推断时延较高,将用户的原始数据发送至云计算中心进行推断的方法则可能导致隐私泄露。针对现有计算模式的不足,端边协同推断能够综合利用智能终端设备和边缘设备的计算能力以降低终端设备的推断时延。然而,智能终端设备中的异构处理器存在性能差异,工业生产的高温环境也可能对处理器性能造成影响,同时,终端和边缘设备之间的环境复杂多变,这对构建基于端边协同的深度神经网络推断系统带来了巨大挑战。针对上述问题,现有工作已经围绕深度神经网络并行计算、终端设备计算加速以及端边协同推断框架等技术展开了研究,但现有工作存在如下问题:一方面,终端设备推断加速技术未考虑温度对设备处理器性能的影响,且仅针对任务做粗粒度划分,没有根据神经网络各层的结构和数据量特点以及处理器性能对单层做细粒度的计算任务划分,未充分利用智能终端设备计算能力;另一方面,端边协同推断方法未综合考虑终端设备计算能力及能耗、边缘设备计算能力、端边间网络状况等约束,难以保证端边协同推断的低延迟和鲁棒性。为此,本文针对终端设备深度神经网络低推断时延要求的特点,研究基于端边协同的深度神经网络推断加速技术。首先,在智能终端设备中,本文提出了温度约束下的终端设备异构处理器推断加速技术,该技术分为终端设备动态频率设定和深度神经网络单层计算负载划分两个部分,前者能够根据环境温度和处理器性能等约束设定终端设备中处理器工作频率,从而保证终端设备稳定运行并最大化终端设备各处理器计算能力;后者能够根据深度神经网络单层结构以及终端设备中异构处理器计算能力,针对神经网络单层进行计算负载划分,从而降低终端设备推断时延。其次,在端边协同推断中,本文提出了多约束下的端边协同推断机制,该机制分为两个阶段,端边协同模型分割阶段和在线动态调整阶段,前者能够根据设备性能等条件设定深度神经网络模型划分位置,在满足约束的前提下最小化推断时延;后者能够在端边环境变化时自适应调整模型划分位置,从而保证端边协同推断机制的鲁棒性。最后,根据理论研究成果,本文设计了基于端边协同的深度神经网络推断优化系统,并通过多组对比实验证明了本文所提机制对智能终端设备计算性能的提升以及降低端边协同推断时延的有效性。综上,本文面向工业互联网环境中深度神经网络应用,设计了基于端边协同的深度神经网络推断加速技术,并构建了相应的原型系统。实验表明,本文所提机制能够有效降低深度神经网络推断的时延,并保证端边协同推断的稳定运行,具有较好的鲁棒性。
其他文献
随着电动汽车、数据中心、通信等领域的快速发展,对宽电压输入、高效率的DC-DC变换器的需求越来越大。Buck-Boost LLC级联变换器在高频小型化方面有着优秀的表现,但如何进一步提高变换器的宽输入范围和效率还有待研究。针对Buck-Boost LLC传统控制方法无法在宽输入电压下实现变换器功率管软开关的问题,首先分析确定了最优的中间母线电压,进一步建立了关于功率管占空比、相移范围的软开关边界模
近年来,多智能体系统成为控制领域的研究热点之一,其中,智能体之间运行的分布式协同控制方法依赖于实时可靠的网络通信,这也使得针对通信网络的安全攻击能够进一步对多智能体协同控制造成影响。在常见的通信网络攻击方式中,通信干扰攻击较少依赖于被攻击对象的知识,因此易于实现。在多智能体系统中,通信干扰攻击能够通过影响甚至直接阻断智能体间的信息交互,进而破坏系统的分布式控制性能。对此,本文研究了通信干扰攻击下的
我国城市化进程导致非法占用土地、违章加盖等事件频发,严重影响国家粮食安全和社会可持续发展。较之人工巡查,定点监控采集不同时相下图像自动检测违章建筑的方式更为高效,但监控图像中道路与往来车辆常常干扰建筑物变化检测。为此,本文致力于研究定点监控视角下基于深度学习的车辆检测与道路分割理论与方法,去除车辆、道路信息对违章建筑判别的干扰,支撑违建现象的早发现与早处理。主要研究内容如下:(1)提出了一种基于空
磷是一种宝贵的难再生资源,是生物维持细胞和生命活动的必需元素。双污泥-诱导磷结晶(A2N-IC)系统耦合生物除磷与化学磷回收技术,将污水处理与磷资源回收相结合,产生经济与环境的双重效益,符合可持续发展的需要。然而,随着工业发展和人工合成生物技术的迅速崛起,污水中非活性磷的存在已不容忽视。非活性磷的反应性不佳,并不遵循活性磷(RP,即正磷酸盐)的迁移转化规律,其与污水中重金属、复杂有机物等均可能是导
互联网的快速发展给信息的共享创造了便利条件,同时也为虚假信息的传播提供了生存环境。研究表明虚假信息比真实信息具有更强的传播力度,会对个人的日常生活和社会的秩序产生影响。基于自然语言处理技术的事实检测旨在运用自然语言处理相关技术,自动判断信息的真实性。因此,研究基于自然语言处理的事实检测方法对遏制虚假信息的传播至关重要。基于自然语言处理技术的事实检测任务一般包含文章检索、证据抽取、真假推理三个步骤。
学位
在热工控制领域,被控对象往往表现出大惯性、非线性等特点,这增加了热工对象模型辨识与优化控制的难度。目前热工过程的模型辨识主要基于动态特性试验,但实验往往具有局限性以及操作难度大等不足,而基于现场数据的热工过程神经网络辨识可以很好规避这些问题。目前火电机组热工过程广泛采用的PID控制难以满足大惯性、非线性对象的控制要求,结合一些先进控制策略对大惯性、非线性过程进行控制就显得很有必要。针对以上问题,论
学位
学位
学位