面向边缘计算的可重构人工神经网络加速器研究与设计

来源 :天津大学 | 被引量 : 0次 | 上传用户:llll9909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工神经网络技术在工业界和学术界的迅速发展,其被越来越广泛地应用在生产生活中的各个领域。在实际应用的迭代中,业界要求对更精确、数据量更大的网络进行更低延迟的部署,同时又希望部署的人工神经网络消耗更少的资源和能量。边缘计算技术是应对这个挑战的新兴研究方向之一。本文面向边缘计算技术,研究并设计了一种分布式目标检测模型及用于边缘计算环境的可重构人工神经网络加速器。本文首先对适用于边缘计算环境的人工神经网络模型进行了研究。基于该环境的资源敏感及功耗敏感等特性,采用深度可分离卷积技术提出了一种适宜分布式部署的目标检测模型。其经过参数压缩的特征提取部分比较适合卸载到边缘计算环境中。然后,本文对适用于边缘计算背景的可重构加速器设计方法进行了研究,提出了各工作模块、数据存储方式及通讯接口的设计方案。该架构采用可重构设计方法,使用软硬件协同的工作模式实现了对多种网络模型的支持。同时,引入了数据的升维跳跃存储模式实现了尽可能长的突发长度,保证了数据读取的高效性。在数据输入上,本设计引入了基于多级缓存的数据读取方式,解决了运算单元等待数据时间过长的问题,提高了加速器的运算单元工作效率。为充分利用可重构运算平台的并行性,本文基于并行运算的思想设计了运算模块,在多个维度上提升了加速器的并行运算能力,从而提高了可重构加速器在边缘计算环境中的运算表现。在两个标准数据集上的实验结果表明,本课题提出网络的目标检测能力和主流检测网络相比处于相近水平,同时其对算力和存储空间的依赖有平均约7.41倍的下降。基于Xilinx公司的ZYNQ系列开发板上实验表明,和其他工作相比,本文设计的可重构加速器在功耗依赖和资源利用效率方面有比较明显的优势,所消耗的资源处于较少水平,更适合工作在边缘计算环境中。
其他文献
研究目的:探讨D-二聚体水平与冠心病患者行经皮冠状动脉介入术(Percutaneous coronary intervention,PCI)后不良事件之间的关系。材料与方法:选取冠心病PCI术后发生不良事件(围手术期心肌梗死、下肢血栓形成、脑卒中及大出血事件)患者35例,将其列为研究组。选取PCI术后未发生不良事件患者25例,作为对照组进行比较。对两组患者进行相关项目分析:两组患者年龄、性别、高血
学位
在成像分辨率及精度需求不断提高的背景下,近场成像已成为一种获取微观图像信息的重要技术手段。由于不同物质具有各自不同的介电常数且电学传感单元较为简单,从而在电学领域通过对某一区域的介电常数空间分布进行无损测量,可以实现近场成像。与光学领域的近场扫描成像方法相比,在电学领域通过片上电路阵列来实现近场成像,具有成像时间短且成本低的优势。当前实现片上近场成像或介电常数测量主要是基于:探测振荡器在不同介电常
学位
为了筛选出能有效抑制小粒材小蠹伴生镰刀菌的杀菌剂,在实验室条件下,采用菌丝生长速率法,选用25%吡唑醚菌酯悬浮剂、450 g/L咪鲜胺水乳剂、40%百菌清悬浮液、25%氰烯菌酯悬浮剂、430 g/L戊唑醇悬浮剂、30%丙硫菌唑悬浮剂、42.4%唑醚·氟酰胺悬浮剂对小粒材小蠹3种伴生致病菌腐皮镰刀菌(Fusarium solani)、层出镰刀菌(F.proliferatum)和藤仓镰刀菌(F.fuj
期刊
近年来,由于各种三维扫描设备获取的点云数据具有距离和轮廓信息,正广泛应用于自动驾驶、工业检测和地形测绘等领域。然而采集的原始点云数据往往存在一定的缺陷,目标间的相互遮挡造成的点云缺失现象会对点云数据的分析和识别带来困难,如何利用残缺的点云预测完整的目标点云成为了当前深度学习技术在点云应用上的研究热点。三维传感器的运动和点云拼接也会使得采集到的点云数据存在一定的噪声,现有的去噪算法难以恢复尖锐的特征
学位
物体的深度信息在三维重建、机器人导航和自动驾驶等计算机视觉任务中发挥着重要的作用。近年来,双目立体视觉作为一种从立体图像对中获取深度信息的技术,被广泛地应用到各个领域。然而双目立体视觉仍存在一些技术难题,例如难以在资源有限的硬件平台上实现实时的立体视觉系统、现有的系统算法在病态区域匹配精度较低等,使得双目立体视觉在实际场景中的应用受到了限制,本文围绕着上述问题进行了研究,主要工作如下:本文基于FP
学位
MOS器件是构成集成电路的基础元件,随着器件的尺寸进入到深亚微米级,由热载流子效应带来的可靠性问题变得越来越严重。热载流子效应通过损伤栅氧化层,使器件的直流参数和射频参数发生退化,严重影响了器件的性能和电路的稳定性,因此研究MOS器件的热载流子效应具有重要意义。评估热载流子效应影响的重要方法是对器件施加热载流子应力,测量其参数的退化情况。目前对直流应力下器件热载流子退化的研究已经较为深入,但是对射
学位
<正>空气电池结合了可充电电池和燃料电池技术的精华,再利用“金属+空气=电力”的公式,正极使用能吸收氧气的材料,负极使用金属等材料。放电时,金属离子从负极向正极移动,与从空气中吸收的氧气发生反应而产生电;充电时,金属离子与氧分离并从正极移动到负极。
期刊
红外成像系统近年来在军事、民用和医疗等领域发展迅速,非制冷型红外探测器因具有低功耗、低成本和高可靠性等优点备受青睐。但非制冷型红外探测器存在的非均匀性严重影响成像质量,因此对红外图像的非均匀性校正成为红外成像领域研究关键问题之一。基于场景的非均匀性校正算法可以有效解决基于定标校准方法无法连续工作的问题,但是现有的基于场景的非均匀性校正方法,还存在校正后图像存在伪影、边缘模糊和细节信息丢失等问题,因
学位
微光CMOS图像传感器集成度高、功耗低、成本低,因此在安防监控、军事侦察、医学成像和空间对地遥感等领域都有非常重要的应用价值。在低照度下,来自像素和模拟读出链的噪声是限制成像质量的关键因素,为了降低CMOS图像传感器的噪声,可以采用相关多采样(Correlated Multiple Sampling,CMS)技术。但是对于常规CMS技术,信号转换时间随采样次数线性增加,这会严重影响信号读出速度。本
学位
随着信息技术的发展,无线通信系统对射频收发机性能的要求越来越高。微波滤波器作为重要的选频器件,对收发系统的整体性能起到重要的作用,高性能、小型化微波滤波器一直是各国科研人员的研究热点。在微波滤波器的设计过程中,基于混合电磁耦合理论指导设计的滤波器可以较自由地引入传输零点并控制传输零点的位置,实现良好的阻带抑制。在混合电磁耦合理论的指导下,本文分别基于低温共烧陶瓷(Low Temperature C
学位