【摘 要】
:
2016年以来,随着AlphaGo在人机围棋比赛中的大胜,深度强化学习算法成为了智能系统决策技术的核心。集感知和决策功能一体化的端到端设计是人工智能发展的关键。目前深度强化学习主要在GPU和CPU等平台处理,速度慢和功耗高,限制了其应用于对实时性和功耗要求高的终端场景。如今,现有神经网络加速器已广泛应用于CNN和LSTM等感知算法,然而现有片上加速方案对决策领域的深度强化学习支持较少。
为在片上实现对深度强化学习决策运算的加速,以及满足如今快速迭代发展的深度强化学习算法在决策终端的广泛应用。本文
论文部分内容阅读
2016年以来,随着AlphaGo在人机围棋比赛中的大胜,深度强化学习算法成为了智能系统决策技术的核心。集感知和决策功能一体化的端到端设计是人工智能发展的关键。目前深度强化学习主要在GPU和CPU等平台处理,速度慢和功耗高,限制了其应用于对实时性和功耗要求高的终端场景。如今,现有神经网络加速器已广泛应用于CNN和LSTM等感知算法,然而现有片上加速方案对决策领域的深度强化学习支持较少。
为在片上实现对深度强化学习决策运算的加速,以及满足如今快速迭代发展的深度强化学习算法在决策终端的广泛应用。本文旨在实现速度快和功耗低的可重构DQN加速器,提出一种基于粗粒度可重构阵列体系结构( Coarse-grained Reconfigurable Array,CGRA)的片上DQN迭代决策加速器设计。采用分布式思想设计了加速器的通用存储映射结构,有效契合了网络并行运算和DQN迭代决策的数据结构需求;提出了一种支持网络分层描述的可重构指令集设计,从而可灵活实现DQN算法的部署;为了在片上实现基于DQN算法的迭代决策,提出了一种支持学习和验证模式下的片上动作迭代决策算法;设计了一种具有多种运算模式的可重构处理单元(Reconfigurable Processing Element,RPE),进而满足相应网络的神经元运算模式;基于RPE阵列和输入输出移位寄存器实现了并行流水线计算设计。
本文基本完成了加速器的各个模块的硬件设计和实验仿真测试。实验数据表明,本文设计总体性能较高,具有明显的优势。基于UMC 65nm CMOS工艺的逻辑综合结果显示,处理器主频为100MHz时,计算模块面积仅占0.74mm2 ,计算功率约为16.49mW。相比于i7-8700 CPU,本文可重构加速器极大的缩减了神经网络运算时间:在全连接网络模式下,提升了接近200倍的计算性能;在DQN验证模式下,提高了至少100倍的Q迭代决策速度;在DQN训练模式下,减少了接近50倍的训练时间。在100MHz下,计算能效达到160Gops/W,相比于CPU,提高了约32倍。
其他文献
摘 要 习作评价提倡要回归指导学生的“学”,指导学生的“写”,指导学生的“改”。在中学作文教学评价中,要关注习作主题要素,靶向教学支架,设计结构化任务,让习作评价指向习作内容与学习内容的“互证”,实现习作评价序列化,评价方法结构化,评价思维进阶化,从而提高中学生习作能力。 关键词 习作评价;习作教学;写出人物精神 随着统编版教材使用的不断深入,广大一线教师已经初步达成了作文评价要回顾学生的
摘 要 “真实性”是叙述者的不懈追求。虚构的小说如何才能显得更真实?以《植树的牧羊人》为例,从人物行为的抒写,叙述节奏的把握,细节的逻辑照应三个方面,阐明小说真实生命力的具体体现。 关键词 人物行为;叙述节奏;细节逻辑 《植树的牧羊人》是1953年让·乔诺应美国《读者文摘》约稿,为杂志专题“你曾经见过的最非凡、难忘的人是谁”而写的。由编辑的初衷来看,这是要“写真实”,但却让·乔诺虚构了一个
高三物理复习,要全面系统地掌握物理概念及相互关系,熟练掌握物理规律、公式及其应用,总结解题方法与解题技巧,提高分析问题和解决问题的能力。 细化复习计划。高三物理复习可分为四个阶段:(1)利用暑假全面回顾教材,复习原有笔记及相关例题,巩固所学的基本概念、基本规律;(2)从9月到春节前后,针对各单元知识点进行分析、归纳,明确各概念间的相互关系、物理規律的应用和基本解题方法;(3)从3月到4月,进
海洋是人类维持生存繁衍和社会实现可持续发展的重要基地,对未来海洋资源的探索和开发离不开现代信息与通信技术。水下信号传输是海洋通信所面临的挑战之一,水声信道严重的多径效应以及复杂的环境噪声给水声通信带来极大困难。如何适应这种时变和频变信道特性,采用无线通信技术中的信道编码、OFDM、均衡、时间反转和 MIMO 等关键技术在水下的探索应用,是目前水声通信领域关注的热点。针对实际应用中水下信号传输时延扩展和拖尾交叠带来的影响,本文提出一种改进型频移键控技术的图像传输方法,从理论和实验探讨水声传感技术、上位机视觉
随着天线阵列技术小型化的发展需求,阵元之间的互耦问题已成为目前研究的难点.而对于无线通信系统来说,天线是最关键的部件之一,良好的天线设计可以放宽系统要求并提高整体系统性能,因此,研究以及设计天线都应将互耦考虑进去,深刻理解天线之间的互耦现象并积极寻求互耦改善方法意义非凡.
本文以二元微带天线阵列为出发点,通过研究平面超材料和立体金属波纹技术减少阵元之间的互耦,论文的主要内容如下:
1. 首先对开口谐振环和金属波纹表面的去耦研究进展进行了回顾,接着着重分析微带天线的基本原理及其互耦现象.
随着现代反射面天线通信系统的快速发展,馈源作为整个天线系统的核心,在反射面天线的整体性能中起到了极其重要的作用,因此,研究改善馈源特性的技术来优化反射面天线的性能具有重要意义。本文主要针对反射面天线中改善馈源方向图对称性和正交模耦合器(OMT)展宽工作带宽的技术展开研究;论文的主要研究包括以下几方面:
1. 馈源的研究与设计。首先,基于波导模式转换的基本原理,提出在波纹喇叭喉部添加开槽圆波导结构形成的模式转换器来提高输出电磁波的模式纯度从而改善方向图的对称性。然后,对介质棒馈源的辐射特性进行分析
用于非侵入式脑神经活动的检测是脑科学领域长久以来面临的挑战之一。利用脑映射技术来研究大脑不同区域的功能,有助于更好地理解大脑的工作机制。但是,现有的检测手段难以实现高时–空分辨率、大范围的神经信号检测。
本文对利用微波对脑神经活动的检测做了相关研究,表明神经元活动使细胞膜电位发生改变,引起脑功能区组织介电特性的变化。电磁波可以有效地穿透大脑,脑组织介电特性的变化会引起电磁波传输相位的同步改变。通过对天线阵列不同方向上接收的散射信号进行分析,可以有效地检测到这种变化。
本文的主要内容如下
纳米金属材料由于其独特属性获得了大量研究者的关注,但是这些材料的纳米尺寸常常会导致材料体系的不稳定。纳米金属的烧结是其不稳定性的一个典型现象,烧结会导致纳米材料的纳米特性消失,例如:纳米金属的比表面积大大减少,相应的催化活性位也会减少,这将大大降低纳米金属作为催化剂工作的寿命和效率。因此,对于纳米金属材料来说,阻止纳米金属的长大是获得长期稳定材料体系的挑战之一。
烧结过程可以通过斯莫鲁霍夫斯基熟化或者奥斯特瓦尔德熟化来完成。对于前者,观察其发生过程是比较容易的,但是对于奥斯特瓦尔德熟化,捕捉其过
随着我国向信息化社会的快速迈进,对于通信系统的“空天地一体化”技术也提出了更高的要求。为了能够对太空的卫星、空中飞机、无人机实现跟踪通信, 需要阵列具有全方位半空间的无线电波覆盖,以及快速波束切换的能力。通常许多的仪器和物体具有 4 棱柱或正 6 面体的外形,为了与仪器共形并满足通信系统的半空间辐射需求,因此,采用4棱柱加1顶面的5面立体阵列形式。
本文研究了具有半空间全方位覆盖能力的5面立体阵列天线,利用多面子阵实现波束成形和零陷抗干扰。主要的研究内容及成果如下:
1. 通过研究多面
触觉信息是人与外界交互的重要反馈信号,也是机器人在进行物体抓握等动作中实施精准交互行为的重要反馈信息。本文通过对传感器材料、结构设计、信号处理的阐述与分析,设计了一种基于聚丙烯(Polypropylene, PP)压电驻极体的触觉传感器,并将该传感器应用在机器人假手对物体的抓握中。
(1) 文中从材料电信号转换原理的角度分析对比了压电材料、压电驻极体、压阻材料等材料在信号检测上的差异,并结合人体皮肤的触觉信息特征得出了压电驻极体在检测微小动态信号方面比其他材料更有优势的结论;同时结合聚丙烯(PP