基于忆阻器的卷积神经网络加速器架构研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:dk_wow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络被广泛地应用于图像分类、语音识别等领域。复杂多样的应用场景对网络计算的速度与能耗提出了更严苛的要求,并因此催生了一大批专用加速器。然而基于CMOS器件的加速器通常采用存算分离的冯诺依曼架构,由于数据在存储单元和计算单元之间的频繁搬移引入了大量功耗。基于以忆阻器为代表的新型非易失器件可以方便地模拟生物神经突触结构,实现突触权重存储与乘累加运算一体的非冯计算架构,并极大地提高计算能效,因此在神经网络加速领域有较大优势。本文面向基于忆阻器的卷积神经网络加速器架构,从数据复用策略、互联结构、任务分配策略三个方面出发,研究加速器设计和应用过程中的关键问题,为加速芯片的设计与应用提供理论基础。本文的主要贡献如下:1、提出了一种面向忆阻卷积神经网络加速器的数据复用策略,实现了推理过程中存在的三种类型的数据复用。首先针对卷积神经网络推理计算过程中存在的数据复用类型,设计了一种权值映射方法,通过将卷积核按行拆分成三个部分并分别映射到不同的阵列,为数据复用提供了基础。然后提出了一种数据复用策略,实现了在横向、纵向卷积滑窗过程中输入数据、权重和中间结果的复用,并设计了相应的数据缓存结构。仿真评估结果表明,对比现有工作,采用本文所提出数据复用策略的计算平台在相同的能耗下实现了1.6倍的处理速度提升。2、提出了一种面向忆阻卷积神经网络加速器的层次化互联结构,提高了数据传输的效率。针对计算过程中处理单元之间数据传输具有大型并行多发、多播通信的特点,设计了一种层次化互联结构。该互联结构首先将多个计算瓦片聚合在一起形成一个计算簇,再通过片上网络将簇连接起来。仿真评估结果表明,在并行多发多播的流量模型下,该互联结构相比对照互联结构在传输延时和吞吐率方面有较好表现。3、提出了一种面向忆阻卷积神经网络加速器的任务分配策略。首先针对网络各层计算进度不一致、硬件资源的利用率低等问题,提出了一种任务图生成策略,有效地均衡了各层计算进度、提高了资源利用率。在此基础上,提出了一种基于遗传算法的任务分配算法,实现了处理任务与计算单元之间的良好匹配以及片上互联结构的负载均衡。仿真评估结果表明,对比现有工作,采用本文所提出的任务分配算法能够减小数据传输的能耗,均衡片上网络中各链路的负载,在传输能耗与链路负载标准差方面最高分别实现了46%和36%的降低。
其他文献
新课程背景下,体育课程改革和创新是体育教学发展的必然趋势,而体育学习成绩的评价在课改中起着导向和激励的作用。文章运用文献资料法、专家访谈法等研究方法,以“健康第一”为指导思想,对中小学体育与健康课程学习成绩评价的改革与发展进行探究,力求探索出一套较为实用、便于操作的“六维度”评价体系和量表,以促进体育课程标准的全面贯彻落实和学生的全面发展。
期刊
基于本征正交分解的四维集合变分同化方法(POD-4DEn Var),将四维变分和集合卡尔曼滤波方法相结合,既能构造具有流依赖性的背景误差协方差,又能同化多种类型的观测资料,并且不需要切线性和伴随模式的开发,由于其计算成本较低,因此是具有发展潜力的同化方法。本文利用该方法,开展了卫星和雷达资料的同化试验;同时,检验了卫星资料的全空同化效果,主要工作和结论如下:首先,本文利用POD-4DEn Var方
学位
近年来,世界各国无人机集群智能化水平越来越高,威胁性分析越来越难,因此从无人机集群底层离散数据中推理出无人机集群内部各节点之间的交互作用关系,挖掘出高层次语义信息,如预测出无人机集群的未来运动状态、识别出关键节点,能够为理解无人机集群作战阵型、作战模型、作战意图等提供一条改进完善的新思路。本文根据无人机集群底层位置、速度等信息对无人机集群内部各节点之间的交互作用关系进行推理,得到表示节点之间交互作
学位
图分类是指根据图的拓扑结构和属性信息预测它的标签,它是图数据处理分析中非常具有研究意义的一项任务,在真实世界中具有广泛的应用,例如病毒分类、社区分类、基因突变检测、酶的活性检测。图分类问题的研究主要分为基于图核的图分类方法、基于卷积神经网络的图分类方法和基于图神经网络的图分类方法。基于图核的方法使用基于核函数的学习方法来直接在图上操作,从而对图进行分类。这类方法通常涉及图的分解和映射,时间复杂度较
学位
为增加决策的科学性与有效性,共识决策越来越广泛地被应用于现实决策中,其主要研究如何协调不同决策者之间的偏好以获得群体内部广泛接受的一致意见或解决方案。共识达成往往需消耗大量的时间和资源,如何以最小成本达成共识是群体决策的重要目标之一。由于决策者在共识达成过程中因意见调整方向差异而期望不同的边际补偿,因此单位意见调整成本一般具有非对称性。此外,在实际决策中,决策者往往以区间型意见代替精确意见值,这主
学位
云制造作为一种新的制造模式,通过对地理位置分布不同的企业的资源进行统一的管理和调度,提高了资源的共享性和资源利用率,同时能够更快地响应市场的个性化需求。云制造的相关研究有助于实现中国制造向中国创造的发展。针对个性化产品配置决策和个性化生产配置决策问题,研究人员进行了不少卓有成效的研究。但是,上述研究主要从单个产品、或者单个产品和供应链结合的角度进行研究,很少从“互联网+”云制造的角度出发来研究产品
学位
移动互联网的快速发展促进了智能手机用户的高速增长,智能手机应用涌现而出,为用户提供了丰富的功能,为个人生活提供了便利。与此同时,大量恶意智能手机应用出现,严重威胁着手机用户的安全。其中,安卓操作系统由于其开源性和流行性成为了恶意应用开发者的主要目标,研究安卓应用检测技术对于提高用户的安全性具有重要价值。随着安卓恶意应用检测技术的不断发展,越来越多的恶意应用采用混淆技术来逃避检测,这致使现有的检测技
学位
互联网电商时代,数字化信息快速发展,市场上的商品信息逐步透明化。聚焦于零售服装行业,服装销售市场是一类完全竞争市场,价格成为消费者追求服装商品高性价比的重要因素,基于小生境理论,大规模服装市场上每个成熟的单品类细分市场,具有相对稳定的基于价格维度的需求分布,即基于服装单品类细分市场,在不同价格区间上有对应的相对稳定的市场需求。本文从零售商视角,提出一种基于单品类细分市场在价格维度的服装计划方法,本
学位
图像复原技术是一种用于提升地基光学望远镜观测到的空间目标图像的分辨率,提升图像质量,丰富图像细节信息的图像后处理技术,在天文观测、目标识别、太空探索以及军事侦察等领域都具有重要研究意义。但由于图像复原问题是一个病态性的反问题,解空间庞大,求解过程容易陷入局部极值解,复原结果对初值估计和先验约束等因素比较敏感。为了提升图像复原算法的性能,本文研究了一种基于成像哈特曼的多通道图像复原算法,该算法将图像
学位
当下瞬息万变的外界环境对企业等组织的响应速度提出了更高的要求,许多企业尝试突破组织边界,整合资源,临时团队应运而生。然而对企业来说,临时团队既是机会也是威胁。许多临时团队甚至还未完成任务就濒临解散。是什么因素导致临时团队表现不佳?该如何改善?这对企业来说是一个具有现实意义的问题。研究发现成员多样性带来的团队冲突是导致临时团队绩效不佳的关键因素。团队冲突并不是一个新的研究话题,许多学者对团队冲突与团
学位