基于RISC-V的卷积神经网络专用指令集处理器研究与设计

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:donggua_dg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RISC-V相较于x86、ARM架构可以更低成本地针对不同应用领域进行定制、优化,近年成为国内外研究机构和企业的研究热点。另一方面,人工智能作为如今最热门的科学技术渗入到各行各业,产生出诸多智慧化产品。但在目前主流的运算平台中,GPU功耗和成本过高,FPGA资源和速度有限,ASIC通用性较差。技术积累深厚的CPU平台更适合用于对成本敏感、算法灵活多变及计算步骤复杂的领域,可是目前通用的CPU难以满足神经网络大规模的计算。为此,本文沿着专用领域处理器架构(DSA)的方向,针对物联网低功耗应用和卷积神经网络人工智能应用设计加速硬件平台,提出了一种基于开源指令集RISC-V实现的专用指令集处理器,对算法进行硬件加速,提高终端设备能效。主要研究内容如下:(1)研究主流指令集架构处理器,分析增强CPU运算能力、提高并行度的方法以及现有卷积神经网络加速方案。并通过研究分析卷积神经网络的运算过程和轻量化方法,设计专用领域的拓展指令和RISC-V开源处理器定制方案。(2)针对轻量化网络模型的特征及基本运算操作,改善卷积神经网络加速器架构及控制方法。加速器重点对卷积和池化操作进行优化;通过自定义拓展指令配置卷积神经网络各层的信息,控制加速器对输入数据进行分组运算,以适应不同大小的输入数据;调整加速器的数据通路,对卷积神经网络的卷积、池化、激活操作进行单独或结合运算,以适应多种轻量化卷积神经网络。(3)在Xilinx Kintex-7系列的Genesys 2 FPGA开发板下,对基于RISC-V架构的卷积神经网络专用指令集处理器进行验证测试。实验结果表明:本文设计的专用领域架构处理器在100MHz的工作频率下运行Squeeze Net网络,推理过程耗时约40.89ms,功耗为1.966W,比手机处理器单核计算速度更快,且相较于其他平台消耗资源少、功耗低,在性能功耗比上更具优势。
其他文献
目的:越来越多的证据表明,长链非编码RNA(lncRNAs)在肿瘤的发生发展中扮演着重要的角色,lncRNAs很可能成为一类新的肿瘤标记物和治疗靶标。本实验拟探讨lncRNA NEAT1作为结直
随着J/ψ粒子的发现,ψ(2S)、ηc、hc等粲偶素粒子相续被发现,粲偶素衰变研究对于理解量子色动力学各种作用机制和粲偶素家族谱具有重要意义,hc粒子作为粲偶素家族成员之一,
随着电力系统的不断壮大,电网的节点越来越多,电力系统中最优化问题的应用越来越频繁。常用的解决方法有经典数学方法和人工智能算法。传统的数值计算能够解决一部分电力系统
蛋白精氨酸甲基化是广泛存在的蛋白质翻译后修饰方式之一,产物是非对称性二甲基精氨酸(aDMA)蛋白和对称性二甲基精氨酸(sDMA)蛋白。但是,对这种修饰的生物学功能的了解还是很
5G移动通信网络正在逐渐拓展商用,其基站天线将与现有2G/3G/4G系统(至少是4G系统)长期共建共享共存,站址资源匮乏和容量不断增长的矛盾日益尖锐。为提升系统容量,2G/3G/4G基
当前,QWD公司在人力资源管理方面存在着一系列问题,比如,员工离职率过高、对企业的满意度低、工作积极性不高、效率低下等,而这也成为阻碍公司持续健康发展的关键问题。分析
体育地板是具有承受人们高强度运动及提供运动保护功能的特殊地板,是体育馆地面铺装设施中重要组成部分。我国关于体育地板方面的研究起步较晚、基础薄弱,对体育地板力学性能
对话系统是自然语言处理中一个十分重要的研究领域。随着人工智能的发展,对话系统开始逐步应用于各种领域。构建一个智能的对话系统,更是人工智能领域一个长期的目标。对话系
过敏性气道炎症是Th2介导的免疫性疾病。调节性T细胞(Regulatory T cells,Treg细胞)可以调节Th2细胞的效应功能。FOXP3对Treg细胞的功能以及分化都是必须的。GATA3是Th2细胞
随着我国养猪业从古老的传统养殖方式逐步转型为先进的工业化生产,利用数字信息技术和科学管理模式,提高生猪的健康水平和养殖效率,降低生产成本已成为现代养猪业必不可少的