基于RISC-V开源处理器的卷积神经网络加速器设计方法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:QQ0301
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度学习的发展,卷积神经网络(Convolutional Neural Network,CNN)的硬件加速逐渐成为了研究的热门问题。可重构的加速器与通用CPU相结合的模式,既有通用性,又有针对具体问题情景的优化,成为一种高效地解决卷积神经网络加速问题的方案。但是,一方面商用CPU的专利授权费日益高昂,另一方面商用CPU与加速器各自的开发流程不兼容,有着开发流程复杂等问题,因此以RISC-V为代表的开源处理器+加速器的模式并结合全自动化设计方法,有助于更高效地进行CNN加速平台设计。为此,本文提出了一种基于RISC-V开源处理器的卷积神经网络加速结构及其硬件设计。本文首先通过对现有加速器结构,如加法树结构、脉动阵列结构、Eyeriss结构等进行分析,选取了综合性能较好的Eyeriss结构作为基础,之后在单个处理单元(Process Element,PE)内部、PE阵列的结构、PE阵列之间的并行、系统软硬件划分等四个层面进行研究。在单个PE层面,为了减少PE单元内部数据的移动,本文采用了维护循环数组指针的方式,提高了PE单元内部的运算效率。在PE阵列的层面,本文针对Eyeriss结构在卷积神经网络运行后期容易造成PE资源浪费的问题,提出了一种尺寸自适应的加速结构,有效提高了PE资源的利用率,进而对卷积神经网络起到了加速作用,此外也针对不同网络以及卷积层可能存在的Stride不同的情况进行了优化。在PE阵列之间并行的层面,本文利用输入输出混合并行的思想,分析了基于输入特征图和输出特征图的并行结构对带宽、缓存等的要求,最终在网络结构不改变的情况下设计了2×1×2的并行加速结构,在控制访存带宽的同时提高了加速效果。在系统软硬件划分方面,为了提高本文设计的灵活性,对系统的控制逻辑等进行了适当的划分,提高了系统对不同网络结构的适应性。本文在Rocket-Chip Emulator中对设计进行仿真,在Vivado软件中进行仿真和综合,测试结果表明:在使用本文结构的情况下前向流程的周期数缩减为串行的19.46%。相比普通Eyeriss结构,本文效果提高了22.3%。引入了输入输出特征图的并行结构后,一张图完成前向流程的周期数缩减为串行结构的11.6%,相比普通Eyeriss结构,本文效果提高了13.01%。实验结果验证了该结构在加速卷积神经网络方面的有效性,同时综合结果也说明硬件资源的消耗在可以接受的范围内。
其他文献
随着现代农业的快速发展,信息化技术在农业科技推广服务、农业科技教育、精准农业、农业气象服务、农产品市场信息服务、食品质量管控与溯源服务、农业金融服务等农业信息服
以2012-2014年我国创业板及中小板共978家公司为研究对象,对其在风险投资背景下上市公司的会计稳健性所受影响进行考察。研究结果表明:在我国创业板和中小板上市公司中,风险
人防工程三防控制系统是确保战时工程内部清洁并为人员提供生存保障的重要手段。但目前主要实现方式都是将远端待控设备通过PLC与监控主机相连,带来墙体隔绝性能下降、后期维
目的:观察隔姜灸中极穴干预腰椎间盘突出症手法复位后尿潴留的临床效果。方法:将49例腰椎间盘突出症手法复位后尿潴留患者随机分为观察组26例和对照组23例,对照组给予常规诱
目的探讨一种简便可行的人脐血基质细胞冻存方法. 方法采用5%二甲基亚砜(DMSO),3%羟乙基淀粉(HES)和4%人血白蛋白(HAS)作冷冻保护剂-80℃冻存人脐血基质细胞,观察不同时相点
会议
目的了解新疆乌鲁木齐市男男性行为者(MSM)高危性行为、安全套使用情况及分析其影响因素。方法在乌鲁木齐市釆用非概率抽样的同伴推动法,以网络为平台,采用自编及改编问卷以
"既要金山银山,也要绿水青山,绿水青山就是金山银山。"为了实现中华民族伟大复兴的"中国梦",习大大提出了"两座山论"。因而每个城市都应积极响应号召,探索适合自己的可持续发
目的探讨急性冠脉综合征(ACS)患者血清白细胞介素6(IL-6),白细胞介素8(IL-8),白细胞介素1β(IL-1β),肿瘤坏死因子α(TNF-α)以及超敏C反应蛋白(hs-CRP)的水平变化及意义。方法采用化学发
前人在研究复吸机制的问题上一直使用动物为实验群体,但是在成瘾人群中建立相关复吸模型的研究甚少,本研究基于动物复吸模型建立甲基苯丙胺成瘾者的条件性位置偏爱复吸模型。
财务管理工作是医院体制改革的重要组成部分,把握好会计成本核算管理这个重要手段,优化会计成本核算管理的方式方法,对医院的财务收支、日常资金周转、资产负债等有关财务资