【摘 要】
:
近年来,随着人工智能行业的高速发展,卷积神经网络(Convolutional Neural Network,CNN)的应用场景逐渐从服务器云端向嵌入式终端过渡,但是由于其庞大的计算量难以在嵌入式终端进行部署,所以CNN的硬件加速逐渐成为当今社会的研究热点。通用处理器(Central Processing Unit,CPU)集成CNN加速单元的模式更具有通用性,并有助于对解决特定场景的优化问题,从而
论文部分内容阅读
近年来,随着人工智能行业的高速发展,卷积神经网络(Convolutional Neural Network,CNN)的应用场景逐渐从服务器云端向嵌入式终端过渡,但是由于其庞大的计算量难以在嵌入式终端进行部署,所以CNN的硬件加速逐渐成为当今社会的研究热点。通用处理器(Central Processing Unit,CPU)集成CNN加速单元的模式更具有通用性,并有助于对解决特定场景的优化问题,从而成为卷积神经网络加速问题的高效解决方法。受限于商用CPU日益高昂的专利授权费及与加速器各自的开发流程不兼容等问题,以第五代精简指令集(Reduced Instruction Set Computer fifth edition,RISC-V)为代表的开源处理器结合CNN协处理器的模式,可以更高效地实现CNN在嵌入式终端的部署。为此,本文提出了一种基于RISC-V开源处理器的卷积神经网络加速器设计。首先,本文介绍了RISC-V指令集架构和指令扩展的原理及方法,利用RISC-V的可扩展性提出一种基于开源处理器蜂鸟E203的卷积神经网络加速指令及协处理器设计。其中,加速器使用可以同时计算双层卷积的协处理器,第一层卷积操作使用行固定脉动阵列,对权重、部分和及特征图数据充分复用,减少访存,对卷积操作进行加速计算;第二层卷积操作使用加法树结构,复用第一层卷积的数据,进一步减少访存及减少功耗。本文还采用流水线架构降低协处理器的复杂度,进一步实现加速功能。其次,考虑到处理器架构通用性及灵活性的问题,本文设计了可选的两种激活函数分别是Sigmiod函数和Tanh函数以及两种池化方式分别是最大池化和最小池化,并且支持单层卷积计算。最后,为验证本文提出的加速器架构的功能,利用Vivado平台对加速器各个模块及整体系统进行功能验证和综合。实验表明,在使用本文架构的情况下,对于激活操作运行速度提高了31.85倍,对于卷积计算运行速度提高了552.79倍。资源消耗表显示协处理器约占整体系统的95%。其中动态消耗约占67%为0.509W,静态消耗约占33%为0.248W。
其他文献
近年来,政府相关部门先后出台了《国务院关于当前发展学前教育的若干意见》《幼儿园工作规程(2016年修订版)》《学前教育保教质量评估指南》等文件,体现了国家对于推进幼儿园保教结合、提升幼儿园保教工作质量的重视。落实以上政策仅仅提高幼儿教师保教能力远远不够,保育员在其中也扮演着重要角色,需要提高保育员职业能力和专业性,才能更好开展幼儿教育,推进幼儿园师资队伍建设,提升幼儿园办园质量。因此,本研究以生态
目的:建立一种特医食品中含硫氨基酸的测定方法。方法:采用氧化水解的样品处理方法与全自动氨基酸分析仪对特医食品中含硫氨基酸进行测定,并进行方法学研究。结果:磺基丙氨酸的校正方程为y=10.119 9x+22.822 9,相关系数为0.999 6;蛋氨酸砜的校正方程为y=10.361 1x+21.784 2,相关系数为0.999 6。加标回收率在95.2%~100.6%,RSD在1.1%~2.0%,且
作为农业大国,我国农产品市场已由卖方市场转变为买方市场,同类农产品之间的竞争已经深化到品牌层面,市场上进口农产品和本地农产品在同台竞争,这使得国内农产品即使不出国门也得面临国际竞争。为此,我国农产品必须注重品牌建立与传播,实施品牌经营战略。2018年农业农村部发布文件《关于加快推进品牌强农的意见》,其中提到“讲好农业品牌故事,以故事沉淀品牌精神,以故事树立品牌形象”。由此可见,讲好品牌故事是我国农
为实现基于声信号的变压器状态监测与故障诊断,提出了一种基于改进的瀑布声谱图-卷积神经网络的变压器声信号识别模型。首先采用基于小波变换和独立分量分析的联合去噪方法对声信号进行去噪处理;其次使用主成分分析改进瀑布声谱图,对声信号进行特征提取;然后设计适用于变压器特征声谱图识别的卷积神经网络结构,优化各层网络参数,实现对变压器声信号的特征识别;最后采集三种运行状态下的变压器声信号进行试验分析,变压器声信
在19世纪的英格兰,议会作为主权者,其所扮演的角色一面朝向政治世界,另一面朝向法律世界。但众多的事例证明真正的政治主权者并非议会本身,而是落脚于选民之上。于是,现实的情况是议会在作为法律主权者的同时“兼任”政治主权者一角,其在政治世界的主要功能是将真正的政治主权者,即选民的意见宣告于议会当中。这使得政治主权与法律主权在运行当中将产生一个问题:即如何保证选民的意见进入法律世界?针对这一问题,众多学者
近代对麦积山石窟的考察研究始于1941年冯国瑞的考察活动。1946年,李浴考察麦积山石窟并撰写《麦积山石窟调查报告》,该报告一直未公开发表。直至2017年《陇右稿抄本文献丛书(第一辑)》收录该报告的影印照片,其完整内容方才与公众见面。《麦积山石窟调查报告》共计一万余字,收录了169个洞窟、碑刻、摩崖等内容。通过对这份手稿进行整理,结合实地考察,可以得出如下结论。首先,李浴于1946年考察麦积山石窟
在幼儿园的一日活动中,自主游戏最能体现出幼儿的真实面貌,为教师的观察提供了很好的“着力点”,教师可以从中发现契机,从而开展教育。教育行政部门也通过颁布《幼儿园教育指导纲要(试行)》、《3—6岁幼儿学习与发展指南》等文件形式以明确幼儿观察行为的必要性,故观察的价值与必要性不言而喻。但在一线实践中,教师的自主游戏观察行为仍然存在问题,尤其是刚踏入幼儿园工作不久的新手教师,因此必须重视新手教师观察行为的
目的 研究白细胞介素(IL)-9在小鼠肺结核模型中对T调节细胞(Treg)的作用。方法 建立结核菌感染小鼠模型,致敏的CD4+T细胞(Teff)与Treg按1∶1、1∶2、1∶4、1∶16进行培养,选取最适比例,设置对照组、Treg组、IL-9抗体组、生长转化因子β(TGF-β)抗体组、IL-10抗体组和IL-9组,应用流式细胞术检测培养细胞中Treg比例,ELISA法检测细胞培养上清液中IL-2
随着我国工业的快速发展,钒污染问题日益突出。为了更好地处理水体环境中钒污染问题,本试验采用共沉淀法合成镁铝层状双金属氢氧化物(Mg-Al LDHs),通过X射线衍射(XRD)、扫描电子显微镜(SEM)、傅里叶红外光谱(FTIR)3种表征手段对材料进行表征分析。结果表明,Mg-Al LDHs结构完整,结晶度较高,有良好的层状结构,符合典型的水滑石结构。另外,还对吸附剂与钒的等温吸附和吸附动力学进行了
自我积极偏向是指人们把积极的特质或结果归因为内在的,稳定的个人特质,而认为消极的特质或结果与个人特质无关。自我积极偏向有利于保持积极自我形象,维护心理健康。以往研究发现人们普遍存在自我积极偏向,这些研究忽视了威胁对自我积极偏向的影响。自我积极偏向对于维护和保持自尊起到重要作用,因此考察威胁对自我积极偏向的影响具有重要意义和价值。此外,有研究发现外显自我积极偏向和内隐自我积极偏向是两种心理加工的过程