面向高密度计算的众核SoC硬件加速设计技术研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:haobishuiduo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
众核系统芯片(System on Chip,SoC)以片上网络(Network on Chip,NoC)为通讯架构,具有并行度高、扩展性强、功耗可控等特点,在面向高密度计算等领域,备受业界青睐。人工智能算法具有天然的高密度计算属性,因此,在人工智能领域,基于众核的硬件加速技术成为研究热点。如何充分挖掘片上网络与人工智能的新特性,解决延迟、扩展性等一体化设计问题,成为新的挑战。本文以此为研究对象,从以下两个方面开展研究工作:(1)在线计算配置参数降低延迟上界;(2)基于多播NoC提高卷积神经网络(Convolutional Neural Network,CNN)计算速度。主要工作有:(1)可在线计算配置的冲突优化硬件设计针对准动态冲突矩阵的方案存在自动化程度不高等问题,建立可在线计算配置的冲突优化硬件平台。硬件平台根据映射方案预测网络的所有冲突情况,计算出动态库文件。片上网络工作时,硬件平台实时监控片上网络的冲突情况并结合动态库文件,调整目标数据流的传输路径和流量分配,降低片上网络的拥塞程度。实验结果表明,对于不同的映射方案,网络延迟都有不同程度的改善。对于网络平均延迟,平均可降低14.57%;对于网络的延迟上界,平均可降低31.13%。(2)基于多播NoC的CNN硬件加速设计针对已有CNN加速方式扩展性差的问题,设计实现基于多播片上网络的CNN硬件加速器。本设计充分发掘CNN中大量存在的数据重用特性,将硬件加速设计和数据重用结合起来,设计实现了基于LeNet-5神经网络的手写识别众核SoC,对手写数字图像识别过程进行硬件加速。在多播片上网络的节点挂载硬件加速单元,协调多个硬件加速单元运行提高计算速度。实验结果表明,与基于硬件的已有工作相比,图像识别速度提升17.97%;与基于CPU的软件实现方式相比,加速比为5.06。
其他文献
目的系统评价维生素A补充对儿童肺炎的疗效和安全性。方法检索Cochrane Library、EMbase、Pub Med、中国生物医学文献数据库、中国知网和万方数据库等中英文数据库,选择其中
<正> 这一期开篇发表了纪念列宁诞辰110周年的专栏文章:《论列宁语言研究》,作者是文章中论述了《列宁语言词典》的编纂问题,指出苏联科学院俄语研究所从1972年开始进行这项
翻译是两种语言符号的转换,这一过程中往往会出现误译。误译,有时是严重的语法问题,有时涉及到词语选择不合适、意义表达不清晰、句子结构不通顺等问题。误译即使是名家名作也不可避免。我们需要客观冷静地看待误译现象,从错误中总结经验,进而提高翻译质量。本文是一篇翻译实践报告,翻译实践材料选自荷兰裔美国传媒帝国之王爱德华·博克的自传《爱德华·博克:成为美国人》(The Americanization of E
为满足经济发展的需要,矿山开采的规模、速度等相比过去都有较大幅度的提升,人们在享受能源资源所带来的经济效益的同时,逐渐认识到其对环境所造成的破坏,为降低矿山开采活动
介绍了哈氏合金C—276的基本性能和其焊接工艺,并详细叙述了焊接操作要领。
体育是学校教育体系的有机组成部分,是对学生进行思想品德教育的重要途径。体育教师要结合学生的个性特点和教材内容,根据具体的教学情境灵活运用说服教学法、表扬鼓励法、实
随着社会的快速发展和国家对于水利政策的调整,吉林省中部地区水资源供需不对等,生活、生产和生态用水矛盾突出,如果想要解决此地区的缺水情况,需要在节水、治污和产业结构调整的基础上,通过从水质较好的松花江调水来解决吉林中部地区的缺水情况。中部供水工程从丰满水库库区引水,是解决吉林省中部地区城市供水问题的大型调水工程,中部供水工程的实施将为长春市、四平市、辽源市及所属的九台区、德惠市、农安县、公主岭市、梨
目的:研究和剖析“蝴蝶”技术的动作结构特征,探讨头部及上肢各关节运动特征对轮椅前进速度的影响,上肢及躯干各主要肌群在一个轮椅推动周期内的施力及做功情况。通过生物力
随着全球经济的不断发展,世界各国贸易往来日益频繁,世界经济一体化进程不断加快,在此背景下国际货运代理行业经历了高速发展时期,从事这一行业的人员规模扩展迅速,并已成为
作为唐诗选本,《唐诗三百首》有着明显的局限性。一是《唐诗三百首》在选诗上偏重"温柔敦厚"的诗作,轻语言凝练奇谲、表达过于直接之作;二是在所选诗歌风格、结构、用韵上的