基于脉动阵列结构的卷积神经网络算法加速研究与设计

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:baoyuan000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着卷积神经网络在多领域得到广泛应用,各种平台和设备对神经网络的需求日益突出。由于神经网络具有高吞吐、高计算的特性,通过提升卷积神经网络硬件加速器的计算效能、硬件利用率和灵活性来获得更好地加速效果显得尤为重要。本文围绕不同类型的卷积运算加速器的算法加速及硬件体系结构展开研究,主要工作如下:本文基于脉动阵列结构提出一种动态可重构的通用卷积神经网络加速器设计方案,与传统的加速器设计不同,该加速器在同一硬件架构的基础上实现了对标准卷积、分组卷积和深度可分离卷积的加速计算,具有高度的适用性和灵活性。本文针对大规模尺寸的卷积层运算,提出一种基于MTCA分块并行计算的方法,实现了卷积展开和中间过程矩阵的分块,有利于硬件上实现高度并行化。在此基础上,提出了中间过程矩阵最优分块的具体计算方法,实现了算法的最优,较传统的im2col算法节省了60%以上硬件存储空间,尤其是在计算较大尺寸卷积情况下,较传统im2col算法节省近82%的存储空间,为大尺寸卷积计算提供了有效的解决方案。本文针对具备稀疏特性的卷积层运算,提出一种卷积基于SparseWinograd F(2×2,3×3)分解计算方法,不仅消除了Winograd算法复杂的预运算,降低了算法硬件实现难度,同时也极大拓展了硬件的灵活性。对于VGG-16、Mobile Net V1实现了3倍至4.15倍的加速,较Winograd算法提升了1.4-1.8倍左右的加速。本文基于SCALE-SIM模拟器以轻量级网络Mobile Net系列作为测试基准,在不同实验条件下加速器对新型卷积运算加速进行了详细的实验分析。通过系统全面的实验,我们为基于脉动阵列的轻量级神经网络加速器的设计空间,主要对包括运算效率、加速比、循环时间等各指标权衡在内进行了深入探索,解决了在该领域研究成果不足的问题,为后续的开发人员更快、更好的开发针对轻量级神经网络的硬件加速器提供了极大的便利。通过我们的研究实现了Mobile Net V1在特定数据流和核心计算规模下近1.2倍的加速。
其他文献
农药在世界范围内广泛用于改善粮食生产,满足全球人口逐年增加的需求。我国作为传统的农业大国,为了有效遏制大规模虫害,农药已被人们广泛的应用于农业生产中。新烟碱类农药,如吡虫啉(IMI)、噻虫嗪(THX)、呋虫胺(DNF)等,因其高效、低抗性,已被广泛应用于水果和蔬菜中防治刺吸式口器害虫。然而,不能忽视的是,大多数新烟碱类农药对环境和人类健康构成严重的化学污染威胁。到目前为止,各种分析方法已被用于新烟
学位
Ge2Sb2Te5(GST)是最著名的硫系相变材料之一,它可以实现新型的、非易失性的、可擦写的纳米光电器件。本论文提出了三种基于GST相变材料的可擦写、非易失性的近、中红外亚波长吸收器。第一种是在近红外波段的对偏振和角度敏感的完美吸收器。数值模拟表明,在GST薄膜预先设计的晶化区域完全晶化状态下,会形成折射率光栅,在工作波段的共振峰处几乎可以实现超过0.99的吸收,明显高于GST薄膜处在完全非晶化
学位
随着通信业务量激增,频谱、信道等通信资源愈发紧张。由此多样化的调制样式被用来提高有限频谱资源的利用率,但这也为信息的获取制造了困难。信号调制识别是从信号接收到信号解调的必要流程之一,其作用是对调制样式不明的通信信号进行处理分析得到其确切的调制方式,为之后的解调工作提供基础。现有关于调制识别的大多数技术一般都是基于决策理论和基于特征提取的。但这些方法存在一定的瓶颈与局限性,如复杂信道环境下识别准确率
学位
信息剧增和对信息有效发掘利用的技术手段相对落后是现今大数据时代的突出矛盾,如何从海量信息中挖掘出能为我们所用的“知识”是时代赋予我们当下的又一新课题。本论文结合时代背景和由信息技术发展带来的新挑战与新机遇,以航母装备信息的基础知识图谱构建为研究目标,对于人工智能技术在军事领域的应用进行了新尝试。“知识”是知识图谱构建的关键。由于军事领域的信息具有知识专业性强、保密要求高的特殊性,军事装备知识图谱的
学位
为了快速记录海量病人的诊断信息,医生往往在病历中记录疾病简写或俗语等不规范的术语,再由专业人员对这些术语进行标准化,以便后续利用这些信息开展跨院交流、界定医疗保险等。因此,自动对病例中疾病的医学术语进行标准化成为了医疗领域的迫切需求。本文将中文ICD-9医学术语标准化问题分成两类情况处理,分别是一对一数据的标准化问题和多对多数据的标准化问题,主要工作如下:(1)针对一对一数据的标准化问题,本文首先
学位
兽用抗生素是指用于预防、治疗动物疾病或者有目的的调节动物机能的一类物质,在畜牧业中应用广泛。然而,兽用抗生素在食品中的残留,随着食物链传播会对人类的生命安全造成极大危害。面对日益严峻的食品安全形势,开发用于动物性食品的准确可靠、方便快捷的兽用抗生素残留检测方法至关重要。竞争型免疫层析检测技术(Competitive Lateral Flow Immunoassay,CLFIA)具有操作简单,检测快
学位
光波偏振特性的快速精确测量一直是偏振技术研究领域的重要问题,其在偏振遥感成像、光纤通讯与传感、薄膜参数测量、生物医学检测等领域具有重要应用。传统偏振检测技术如时序调制型、分光型、干涉型等偏振检测方法因检测速度慢、稳定性差、系统结构复杂等问题,已难以满足当前对偏振检测性能日益增高的要求。空间调制型偏振检测技术作为一种重要的技术方案,具有克服传统检测技术缺点的潜力,但现有空间调制型检测技术大多存在空间
学位
随着物联网的快速普及与应用,无线传感器网络(wireless sensors network,WSN)作为物联网的基础,得到了越来越多的关注。无线传感器网络的拓扑结构,对于无线传感器网络的管理和安全具有重要的意义。因此,对无线传感器网络的拓扑结构进行探测成为一个研究热点问题。无线传感器网络探测主要分为主动探测和被动探测。主动探测方法通过在目标网络节点上安装探测设备,探测数据随目标网络数据包一同传递
学位
大脑由上千亿个神经元细胞组成。以神经元为基本单位,再通过百万亿突触组成巨大的脑网络。脑网络可以实现认知、学习等多种功能。基于脑网络进行认知障碍评估是当前的热点问题。轻度脑创伤(mild traumatic brain injury,mTBI)发生率高达所有脑创伤的76%-83%,所以在普通民众和军人群体中都受到了特别关注。并且,患者在伤后会出现不同程度的认知障碍现象。因此,我们将轻度脑创伤选作基于
学位
磁耦合谐振式无线电能传输技术是一种以交变磁场为能量传输媒介、采用耦合谐振方式且无直接物理连接的电能传输技术。在实际工程应用中,由于线圈间相对位置的变动或系统负载的改变,会使系统输出电压产生较大波动,影响电能传输效果。因此,本文以提高磁耦合谐振式无线电能传输系统的输出功率和输出电压稳定性为主要目标,在系统建模的基础上,分别对系统参数、线圈结构和补偿电路进行了优化研究,主要研究内容如下:(1)依据建立
学位