利用数据可重用性的三维卷积加速器的设计与验证

来源 :东南大学 | 被引量 : 0次 | 上传用户:liongliong572
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维卷积和三维反卷积在动作识别、视频生成、双目匹配等算法中获得了广泛应用。然而,对于这类三维卷积工作负载,现有专用加速器方案仍有提升性能和降低能耗的空间,特别是执行三维卷积与三维反卷积同时存在的网络时,存在大量乘数为零的无效运算和无效访存,导致能耗高且性能低下。因此,本文从优化数据流的角度,以高性能且低能耗地执行三维卷积和三维反卷积为目标,提出了一种利用数据可重用性的三维卷积加速器。首先,本文介绍了加速器的数据流和映射的描述方案,使用循环顺序和并行方式描述加速器数据流,使用切块等参数描述工作负载到加速器的映射。在此基础上,针对三维卷积提出了一种加速器数据流设计,并提出了相应的架构设计方案Uarch1,其核心是利用数据可重用性增加寄存器等片上低开销存储的访存次数,从而减少高开销访存,降低执行三维卷积的能耗。同时,为了快速评估本文设计的加速器执行工作负载网络的能耗和性能,完成了软件工具Uarch-compiler和Uarch-sim,并搭建了加速器的硬件描述,利用数字电路EDA的仿真结果说明了该软件工具评估的合理性。最后,针对同时包含三维卷积和三维反卷积的工作负载网络,本文利用反卷积结构化稀疏和分支结构改进了Uarch1的数据流设计,提出了三维卷积反卷积加速器Uarch2。Uarch2的核心是使用反卷积分解策略降低反卷积层的计算量和访存总量,使用层合并策略降低加速器执行网络中分支结构的高开销存储。实验表明,在典型三维卷积工作负载上,与经典反卷积加速器GANAX、三维卷积加速器Systolic cube相比,本设计Uarch2的执行时间分别减少了11%和28%,平均能耗分别降低了60%和43%。在SMIC 40nm工艺下,本设计的平均性能为459.4GOPS,能效为1.2TOPS/W。
其他文献
C/C复合材料作为一种性能优良的材料,具有耐高温、密度低、比强度高、韧性好等优点,目前已被广泛应用于众多领域。但由于其纤维种类及加工工艺等原因,C/C复合材料的力学性能呈现出较大的离散性,严重制约了工程结构的高可靠性设计。随着工程中对结构安全性能要求的日益提高,按常规安全系数法设计的结构已经无法满足实际工程对于结构可靠度的要求。目前国内外研究大多关注静态载荷下结构的强度可靠度评估,缺乏考虑整个结构
大型燃煤电厂基本均采用湿法石灰石烟气脱硫技术,然而其脱硫工艺流程复杂。脱硫系统属于典型的多变量和大迟延被控对象,采用PID控制很难取得满意的控制效果。因此通过建立脱硫系统的动态数学模型,掌握脱硫系统的动态特性和回路间的耦合关系,并据此研究脱硫系统的先进控制策略,对于有效改善脱硫系统的调节品质,提高脱硫效率,优化运行方式都具有重要意义。本文研究脱硫系统的多变量扰动抑制预测控制方法,并进行仿真验证与应
作为一种具有巨大效率潜力和广泛应用前景的新型能量转换方式,超临界二氧化碳(supercritical carbon dioxide,sCO2)动力循环可获得更具竞争力的循环效率,并且可适用于多种热源,包括传统化石能源、核能、余热回收、可再生能源等。sCO2循环发电技术应用于燃煤发电领域,可以实现化石能源的低碳、清洁利用,对降低碳排放、应对气候变化挑战具有重要意义。结合我国能源现状,本文主要研究面向
由于深度神经网络在图像识别、语音识别、自然语言处理等领域的成功,已经有越来越多的研究学者和工业界人员投入到深度学习的研究当中。而深度神经网络拥有成万上亿的参数,训练一个性能优良的深度神经网络模型需要耗费很长的时间。最近十几年来,图形处理器GPU得到了迅速的发展,如NVIDIA生产的V100,GPU凭借着强大的并行计算能力,是现在主流CPU计算性能的十多倍。同时在CUDA统一计算框架上,NVIDIA
由有机保温材料引起的建筑火灾已成为影响城市安全的一个重要问题,既能满足节能保温要求,又具备良好耐火、耐久性能成为了保温墙体发展的新趋势和要求。作为一种轻质高强、保温、耐久、耐火性能良好的无机保温材料,泡沫混凝土可应用于自保温墙板之中,泡沫混凝土条板预制及现场装配方便,可实现围护和保温的一体化,顺应了当前绿色节能、装配式建筑的趋势。目前,泡沫混凝土已成为建筑材料研究热点之一,但绝大多数研究着眼于泡沫
木材摩擦焊接是一种不借助任何连接件或添加剂的连接技术,避免了金属连接件引起的腐蚀问题,未使用胶黏剂,实现了绿色环保的无胶胶合,对于环境保护、人类健康和经济可持续发展有着重要意义。近年来,关于木材摩擦焊接的研究,多数是借助试验探究焊接参数对焊接性能的影响规律,或通过建立简化的有限元模型,研究焊接构件破坏时的应力分布特征,但有关焊接界面破坏机理的研究则较为匮乏。本文通过试验与有限元模拟相结合的方法,研
在既有砖混结构房屋中,砖墙是其主要的竖向承重构件。由于功能改造或材料性能退化,一些砖墙需要进行加固以提升其受力性能。通过对不同加固方法比较分析发现,钢板加固法具有施工周期短、加固方法简便以及具有可逆性等优点。为进一步优化钢板与砖墙的组合加固效果,课题组提出干式连接钢板刚架加固砖墙的加固方法。钢板刚架既可约束砖墙,提高砖墙的承载力与变形能力,还能独立承担竖向与水平外力,为加固墙体提供第二道抗震防线。
过去相当长一段时期内,混凝土桥梁建设一直存在重安全性轻耐久性的问题,导致了大量的桥梁在未达到设计使用年限时就因耐久性问题失效,尤其是滨海等恶劣环境。氯离子侵蚀是影响滨海环境混凝土桥梁耐久性现状评价和寿命预测的关键因素。因此,开展混凝土中氯离子侵入规律研究以及寻求有效的耐久性维护方法,尤为重要。本文基于惠盐高速深圳段改扩建工程,对滨海环境混凝土氯离子扩散模型,氨基羧酸类阻锈剂和锌基牺牲阳极保护系统两
进入二十一世纪以来,随着材料、飞行控制技术的进步,无人直升机也得到了长足的发展。无人直升机以其体积小、起降便捷、飞行敏捷度高等优点,迅速得到了人们的重视。应用于国防当中,无人直升机有着空中侦察,当作飞行目标物等作用。同时,无人直升机在森林预防火灾监控、山区高压电线的检测等民用方面也有着广阔前景。三自由度直升机模型不是简单的单输入和单输出受控对象。相反,它是一个有着多个输入多个输出的系统。该系统是强
地震作用下,混凝土柱脚通常受到较大的轴向压力和弯矩的共同作用,很容易发生弯曲破坏形成塑性铰,存在严重的混凝土剥落压碎、纵筋压曲、箍筋外鼓崩断等现象。如何减小地震作用下混凝土柱底所受损伤,或使损伤集中于便于修复的地方,是研究者们共同关心的问题。本文在总结现有混凝土柱脚节点的竖向承压性能、剪力传递机制、柱底转动与自复位效果、耗能部件的连接构造与耗能效果等基础上,提出了一种含可更换耗能连接的装配式混凝土