基于RISC-V的神经网络卷积协处理器设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:xiawa371236585
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为人工智能的一个重要分支,深度学习近年来发展迅猛,在国内外引起了广泛关注。其中,卷积神经网络(Convolutional Neural Network,CNN)是深度学习中应用最广泛的架构的之一,在语音识别、图像识别、图像处理等多个领域得到广泛应用。传统的基于GPU/CPU的软件实现方式,由于其处理速度不够快,越来越不能满足手机等应用的需求,本文针对卷积神经网络,基于RISC-V架构,进行了CNN的协处理器的研究与实现。在深入研究各种卷积神经网络后,本文对一种经典神经网络算法进行了建模仿真实验,发现卷积运算作为CNN算法的核心,占据了90%以上的运算量,而且,卷积运算的核心又是矩阵乘累加,可以进一步提炼出原子操作。因此,本文基于RISC-V架构,设计了一颗支持CNN增强的协处理器:为了提高性能,首先本文基于RISCV指令集扩展增加了卷积神经网络相关指令,并进行了相应的矩阵运算内核单元、指令译码、执行等电路实现;同时,为了进一步提高运算速度,减少访存时间,在运算单元等功能模块进行流水线设计,同时进行了高吞吐率的紧耦合存储器设计;另外,由于矩阵运算的扩展指令为多周期指令,需要多个周期才能执行完并写回,会导致RISC-V的流水线结构出现数据相关性问题,本文还在指令派发阶段,实现流水冲突相关性检测电路,并相应的进行流水加速与优化。在完成电路设计实现后,本文搭建了UVM平台对电路进行了功能验证,最后,基于SMIC 110nm工艺,对电路进行了综合,本文设计的具有CNN协处理器的是40423等效门;另外,我们还进行了CNN协处理器设计前后的数据速率测试对比,不支持CNN功能的RISC-V架构的通用处理器本文选用的是蜂鸟处理器。测试结果显示,在能接受的芯片面积增加情况下,本文设计的CNN协处理器,大大提高了数据处理速度,能够满足应用的需求。
其他文献
随着工业化和城市化的发展,人民生活水平不断提高,但经济快速的发展同时也给自然环境带来了极大的破坏,尤其是大气污染问题己经成为当今社会极为关注的环境热点问题。基于金属氧化物半导体的气体传感器具有结构简单、灵敏度高、操作方便和可实时在线检测等特点,在环境监测、家庭安全、公共医疗保障、工业生产等领域得到了广泛的应用。基于P型金属氧化物半导体气体传感器具有低湿度依赖性、快速响应以及对挥发性有机化合物(VO
在现如今的信息社会,各种电子产品层出不穷,它们已成为人类生产生活中不可替代的产品。随着社会的发展,人们对新型电子产品的需求日益提高。有机薄膜晶体管(OTFT)具有质轻价廉、制备温度较低、能够在柔性衬底上制备等优点,因此在大面积制备的柔性电子器件、有源驱动电路、传感器、智能无线射频标签(RFID)等领域具有广阔的应用前景。这些年来,科研人员通过不懈的努力,使有机薄膜晶体管的整体性能得到了提升。但是,
学位
随着世界各军事强国将目光从过去的海陆空领域投向地球之外——太空,作为太空竞争中最重要的一环之一,即人造卫星的电磁隐身被各国提上了日程。人造卫星通常是由机体和几个巨大的太阳能帆板组成。这些太阳能帆板是一种能够吸收太阳能的供能装置。它们的面积通常几百平方米,有的甚至上千平方米,这将引入显著的微波后向散射,从而使人造卫星暴露在危险之中。此外,光学不透明的隐身材料会降低太阳能电池的能量转化效率,从而会影响
Nd-Fe-B系永磁体已广泛用于网络信息、航空航天、电器、通讯设备及光学元器件等领域。由于钕铁硼材料的大量生产导致Pr,Nd,Dy或Tb等稀土元素被过度使用,而随其开采出的高丰度元素Ce等却未被有效利用,造成稀土资源浪费和利用不均衡,由于Ce2Fe14B的内禀磁特性较低从而导致磁体的矫顽力较低这是含Ce磁体发展的主要问题。(Nd,Ce)2Fe14B磁体主要有两类:含Ce烧结Nd-Fe-B磁体和α-
以大单元核心问题为导引就是在大单元主题下,对课堂教学进行核心问题设计,引领学生课前自主参与前置预习与初步构建,课中同伴合作交流、教师引导帮助,达成知识的构建与深入理解,以此促进学生知识结构化。以北师大版"小数的初步认识"为例,从读懂教材、读懂学生与课例分析三个方面进行分析,提出了核心问题设计的原则以及实施策略,从而引导学生建立大单元学习观,初步构建数学知识的认知体系雏形。
钛合金具有密度低,断裂韧性好和强度高等良好的综合性能,在交通运输以及军工产业等领域广泛使用,在国内外一直是研究的热点材料。本文以亚稳型β钛合金TB8(Ti-12.76Mo-2.13Nb-2.73Al-0.16Si)为研究对象,采用强塑性变形(ECAP:Equal Channel Angular Pressing)和热处理结合的二次加工方式(固溶-ECAP-时效、ECAP-固溶-时效),研究不同工艺
颗粒增强铝基复合材料作为一种航天军事以及家庭常见的复合材料,它们具有强度高,耐磨抗腐蚀,塑性良好等诸多优点,越来越被国内外专家学者所重视。本文采用自主设计的工艺过程制备了一种微-纳米Si Cp/6061混杂增强铝基复合材料并对组织进行设计完成初步的宏观调控。采用强度不高但塑韧性较好的6000系铝合金作为基体,实验发现了颗粒的含量,热加压工艺参数,固溶时效工艺对材料有着较大的影响。主要研究内容及结论
近十年来,钙钛矿太阳能电池(PSC)因其低廉的造价、简易的制备工艺和较高的光电转换效率,备受关注。空穴传输层(HTL)作为高效钙钛矿太阳能电池必不可少的组成部分,有着提高空穴转移速率、提高器件光电转换效率和增加器件稳定性的重要作用。有机小分子空穴传输材料(HTM)2,2’,7,7’-四[N,N-二(4-甲氧基苯基)氨基]-9,9’-螺二芴(Spiro-OMe TAD)一经引入便成为最有潜力的材料并