粗粒度可重构神经形态阵列的设计与应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zhangyananqd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,大数据与人工智能蓬勃发展,首屈一指的深度学习技术被用来对数据做特征提取,分类及递归运算,在计算机视觉,自然语言处理以及智能系统决策等领域有着广泛的应用,深度学习算法在硬件上的实现已然成为计算机硬件研究的热点,但随着其网络规模和复杂度的逐渐提升,传统计算机硬件显然已经无法满足所需的加速性能,那么如何加速神经网络的计算更是亟待解决的关键问题。仅仅几年间,各类人工智能芯片如雨后春笋般破茧而出,但芯片性能良莠不齐,大多只是简单的运算器堆叠且只能加速特定的网络层,很少可以适用于迅速迭代的神经网络结构。从而性能优越、可重构配置的神经网络硬件结构的设计显得尤为重要。本文主要设计了可用于神经网络加速的粗粒度可重构神经形态阵列(Coarse-grained Reconfigurable Neuromorphic Array,CRNA)。针对计算资源有限(存储空间小、功耗受限、响应时间短等),设计适用于可移动终端感知处理的新型神经网络加速器结构,拓宽了基于神经网络的硬件应用领域。本文采用全数字电路设计了包含定点数乘加、卷积映射、激活等功能的数字神经元粗粒,并集成128个神经元作为神经网络运算器,神经元在结构上高度统一,并且不存在交叉访问,实现了神经元阵列的级联拓展,可实现任意数目的集成。神经网络的输入层和输出层采用串行移位寄存器实现数据的流入与流出,避免了阵列并行计算访问存储时遇到的存储带宽的问题,有别于传统冯诺依曼集中的指令/数据读写的架构,隐藏层通过分布式存储(参数本地化)的设计实现神经元的并行计算,数据流与参数流的协同调度解决了神经网络计算中数据与指令的通信瓶颈,避免了对存储器的频繁访问,降低存储读写的功耗,实现较为理想的并行计算。神经元阵列使用可复用的部署方式,通过滑窗方式对网络层切片分块计算,可以部署任意节点数目的神经网络层,并以上一层的输出层作为当前层的输入,依次部署多层神经网络,通过灵活配置与重构实现神经元的多种运用模式,实现神经网络整体从算法到硬件的完全映射。根据不同的网络模型结构,配置不同的网络参数和权重,实现了多层混合神经网络的加速。相对于普遍的神经网络加速器,本文设计的粗粒度可重构神经形态阵列具有优越的可重构性,高效的数据、参数访问机制以及较高的计算节点利用效率。由于终端智能化的演进和应用,神经网络加速器承担的神经网络规模也越来越大,所需的存储资源也就越大,本设计专门针对大规模神经网络实现了在FPGA上DDR3的拓展,以存储庞大的神经网络权重,实现了对大规模神经网络加速的支持。
其他文献
小学生还处于身心都未发育成熟的阶段,对于危险的防范意识和承受能力都是很微小的,作为小学生领头羊的班主任,将安全教育做到最好是非常有必要的。安全问题一旦发生所造成的
作为目前最严重的水体污染源之一,典型的有机污染物,具有大排放量、高浓度、复杂成分、深色度的印染废水对人类和生态环境产生了极大的威胁。TiO_2光催化技术在光照下通过一系列的氧化还原反应降解甚至矿化染料分子,是公认的最具潜力的环保型技术。通过制备具备不同长径比的纳米级TiO_2颗粒,具有不同晶相和不同形貌的TiO_2晶体,以及Ag负载、与石墨烯复合的TiO_2复合物,主要探索提高TiO_2光催化活性
在全球商业竞争环境日趋复杂的背景下,创新成为了企业塑造核心竞争优势、推动长远发展的关键。早先,学者们多从组织管理学出发,探究组织环境对员工创新行为的影响,研究主要集中在领导风格、创新氛围等方面。后来,越来越多的学者开始从积极心理学出发,探讨工作压力对员工创新行为的影响,挑战性-阻碍性压力模型的提出,更将这类研究进一步推向高潮。梳理国内外相关文献发现,目前关于阻碍性压力的消极影响,已得到了较统一的定
随着我国社会经济的飞速发展,不同地区的人群交往越来越频繁,越来越多的人开始涌入大城市,城镇化速率明显加快。深圳作为一座年轻化的城市,来深建设的青年外来务工人员数量众
随着多媒体技术的发展,视频获取的途径越来越多,行为识别的应用也越来越广泛,例如:行为分析、危险预警、姿势识别、智能监控系统、人机交互、智能驾驶等,行为识别为这些应用提供了技术方案,具有很大的应用价值。但是视频不同于图片,图片仅包含空间信息,例如:颜色、纹理等信息,而视频不仅有空间信息,还有时序信息,时空特征的好坏直接影响最终的行为识别结果。深度学习发展至今,已在多个领域取得了卓越的成就,越来越多的
生物信息学的出现极大的推动了生命科学相关学科的发展,对于近年来不断增长的生物相关海量数据提供了相应的解决方案。其中蛋白质结构的研究是生物信息学中的一个热点,通过研
本文通过固相法合成钠离子电池正极材料P2型层状锰钠氧化物。研究了不同掺杂量的Cr、V离子和不同修饰量的CeO2对Na0.67Mn0.75Co0.25O2的结构和电化学性能的影响,不同取代量的La对Na0.67Co0.35Ti0.2Mn0.45O2的结构和电化学性能的影响。通过X射线衍射仪(XRD)和拉曼光谱对P2型层状氧化物材料进行结构表征,采用X射线光电子能谱(XPS)对电极材料的元素状态进行分
近年来,深度学习算法被广泛应用于各个领域,然而,大规模的带有标签信息的数据是该类算法取得良好性能的前提条件。众所周知,标注大量数据的成本是极其昂贵的,因而该前提条件不易被满足。值得庆幸的是,现实中存在大量已标注的和目标任务中数据相关的数据集,那么,如何利用已有的带标注数据,在目标任务中数据没有标签信息的情况下,建立深度学习模型以减小标注数据的成本,成为当下研究的热点。本文针对目标域数据标签不足的问
列宁作为马克思主义军事思想的继承人,在领导俄国革命实践中,坚定的推进马克思主义军事思想在俄国落地生根。他深知,军队建设对推翻资产阶级统治、捍卫无产阶级革命果实无比
长航程水下滑翔机是一种具有长航程、大潜深和可反复使用等特点的水下观测设备,其子系统众多且相互耦合,系统整体具有复杂性,造成其研制周期漫长。此外,作为一种水下设备,长航程水下滑翔机湖泊试验和海洋试验条件要求严苛、试验成本高且具有一定风险。因此,作为一种能大大降低成本且能有效缩短研发周期的陆地试验手段,半实物仿真技术对长航程水下滑翔机的研制意义重大。本文主要研究内容如下:1.建立了本文研究对象的数学模