一种基于神经网络的卷积加速器及其后端实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:liongliong503
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,人工智能在各个领域发展迅速,特别是在物体识别,视频监测等方面发挥着十分重要的作用,人工智能所表现出来的卓越成绩和优秀的学习能力,使得越来越多的学者对人工智能产生了极大的兴趣。人的大脑可以控制生物完成十分复杂的学习行为,受此启发使得神经网络得到了发展,卷积神经网络作为神经网络的重要分支,具有容易实现且易训练的特性,同时,卷积神经网络的运算速度也使其发展面临着更严峻的挑战。因此本文提出了一种提高卷积运算速度的方法,这对于卷积神经网络的发展来说具有十分重要的意义。本文设计了一种基于神经网络的卷积加速器的运算核心,共设置了256个PE单元并行完成卷积运算,且每一行PE单元共享输入数据,每一列PE单元共享输入权值,PE单元内部的卷积运算通过乘法器和加法器实现。除此之外,在PE单元内部加入了控制逻辑,用来控制数据调度。并设置了SIMD单元用来进行最大值池化运算以及激活函数的运算,设计核心模块采用硬件描述语言实现。除去PE单元内部的主要运算模块外,输入数据模块采用串行移位寄存器实现,由PE并行读取其内部数据,该并行性在时间上达到了数据复用的效果。且由于SRAM片计算速度快,读取数据高效便捷,在设计中引入了SRAM片和寄存器组来存储中间结果,采用该方式可以减少片外DRAM的访问,从而减小功耗,且中间结果缓存数据可以重新被PE单元读入进行下一步计算,这数据调度和数据复用十分有利。通过PE单元的并行处理使得卷积运算的速度大大提高,该卷积加速器的运算核心模块的实现采用SMIC55nm工艺完成,并使用DCT工具完成了硬件描述语言到门级网表的映射,使用fm工具进行功能等价性验证。使用ICC工具完成布图布局布线,长成了H型的时钟树网络,且时钟偏差满足约束文件的设置,并对其进行静态时序分析,通过了DRC&LVS&ERC以及天线规则检查,最终生成了卷积加速器的运算核心版图文件。
其他文献
人工电磁超表面由于其独特的电磁特性而受到人们的关注,其应用范围很广泛,常见于天线、雷达和多种电磁功能器件。在进行电磁超表面设计时,往往需要用到电磁仿真软件对其进行结构建模、仿真计算和参数优化。当结构较为复杂时,这是一件非常耗时的工作。如何对复杂超表面结构进行快速设计,成为了超表面技术研究领域的一个重要课题。近年来,随着人工智能技术的快速发展,一些专家学者引入深度学习的思想,构建神经网络对超表面的结
磁场传感器的应用十分广泛,在国防建设、科学技术、医疗卫生等领域都发挥着十分重要的作用,是传感器产业的一个主要分支。AMR线性磁场传感器因其灵敏度高、工艺简单、易于集成、成本低、噪音小等优点,是应用最为广泛的磁场传感器之一。AMR线性磁场传感器的性能除了受制备工艺的影响,还受几何参数设计的影响。目前国内的研究主要集中在薄膜材料和工艺上,在传感器的尺寸设计方面研究还较少,因此本文主要研究不同的设计参数
太赫兹波位于微波和红外波之间,具有瞬时性、光子能量低、高穿透性等优良特性,可应用于高灵敏度检测、高精度成像和无线通信等领域。由于太赫兹电磁波不会对生物组织产生负面的电离危害且很多生物大分子在太赫兹波段具有较强的集体震荡,可以增强对生物分子检测的灵敏度,随着太赫兹频谱技术的发展,太赫兹波在生物传感方面的研究成为一个重要方向。超材料(metamaterial)是一种具有特殊的物理特性的人工复合电磁材料
三维霍尔传感器是为了满足现代产业的极速发展而出现的。现在的三维霍尔传感器大多由硅材料制成,其具有良好的工艺兼容性,但由于硅材料的载流子迁移率低、禁带宽度窄,基于硅的霍尔传感器的灵敏度较低、温度稳定性较差。GaAs材料的载流子迁移率高、禁带宽度大,用其制备的霍尔传感器具有更高的灵敏度与更好的温度稳定性,并且可以利用GaAs基异质结的高迁移率载流子特性来进一步提升传感器的性能。本文首先对GaAs基异质
在过去的几年时间里,4G的普及推动着移动互联网行业的飞速发展;可以预见在未来的几年时间中,5G的全面铺开也必将会给物联网带来新的发展。随着网速越来越快,人们对信号传输过程中的编译码时延要求也越来越高。近些年深度学习在很多领域已经取得了重大的突破,也越来越多地被应用于各行各业,其“一次训练到处推理”的特点非常适合用来处理信道译码任务。利用深度学习,在神经网络中学习到某种编码的特征,将带有这种特征的模
近年来,视频作为可视媒体数据的重要组成部分深深影响着人们的生活。视频信号在产生、传输过程中常受到噪声的影响,给用户带来不良的视觉体验。视频去噪是提升视频质量的有效手段,并且是视频处理领域的热点研究问题之一。近年来,基于经典信号处理方法的视频去噪已经遇到了技术瓶颈,基于深度学习的去噪方法正成为主流的视频去噪方法。基于深度学习的视频去噪方法虽然带来了去噪性能的显著提升,但仍无法充分利用视频内部的先验信
在已经步入信息时代的今天,我们的生活中每时每刻都在产生着不计其数的视频数据。而在安防领域,覆盖城市的监控摄像头网络,每天在保卫着人们的生命与财产安全的同时,也会产生大量的监控视频数据。在发生事故后,监控视频通常是用于还原事故原因、追查嫌疑人的有效法宝。但覆盖整座城市的监控网络,其产生的视频不仅数量巨大,而且并非全部视频都包含有用的信息,在人群稀疏处的监控摄像头可能拍摄的大部分视频都是背景。大量的监
伴随着世界更加数字化、信息化,人们开始渴望通信系统领域的相关技术应用可以更加智能化。近年来,一大批深度学习研究学者将目光逐渐深入到军事雷达通信和卫星导航等领域,不断地有基于深度学习的信号调制识别、载波信号检测等算法被提出。然而,深度学习算法复杂,运算起来通常比较耗时。在对相关技术的实际应用中,人们还是希望可以在小巧易携带且节能环保的嵌入式设备上实施操作,并希望能够在低功耗的嵌入式设备上,更快地实现
目前许多无线传感器网络已经用在了环境安全监测中,以至于当安全事故即将发生时安全监测中心能够根据传感器所采集过来的信息提前做出预警;但是当安全事故真正发生时,很多时候安全监测中心并没有提前做出预警或者预警不及时,从而导致人员伤亡。监测系统没有正常运行的原因之一是输入到监测系统中的传感器数据不正确,导致监测系统无法识别出当时环境中的真正情况,从而没有发出预警;因此在监测系统处理对数据进行处理之前,需要
大功率毫米波回旋行波管由于其输出功率大、工作带宽宽、效率高等优点,因此其能够在军事、航空、国防等重要领域发挥重要作用,而要使得回旋行波管正常需要大功率高压电源系统为其进行稳定的供能,因此必须确保大功率高压电源系统工作的稳定性。但因为行波管在工作时可能由于真空度异常而产生打火现象,从而对大功率高压电源系统造成损害,进而影响整个行波管的工作,并且由于大功率高压电源系统其内部关键信号的正常产生与否是确保