基于执行—访存解耦合体系结构的优化方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：skychi

【摘要】

：

执行-访存解耦合(DAE)是一种用于改进处理器访存性能的体系结构,该体系结构通过分解访存和计算使得相关处理器平台拥有较高的计算-访存并发能力。当前DAE架构上的软件开发与

【作者】

：

赵增

【出处】

：

中国科学技术大学

【发表日期】

：

2014年期

【关键词】

：

执行访存解耦合 GPGPU 优化理论龙芯3B 程序执行模型编程模型基础数学库深度神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

执行-访存解耦合(DAE)是一种用于改进处理器访存性能的体系结构,该体系结构通过分解访存和计算使得相关处理器平台拥有较高的计算-访存并发能力。当前DAE架构上的软件开发与优化存在基础库缺失、编程难度大、缺乏编程模型指导等问题。本文就以上问题对DAE架构下优化及编程方法进行讨论,旨在改进应用程序在相关平台上的运行效率。论文从处理器的硬件特性出发,介绍基于DAE架构的优化方法及理论。提出一种适用于DAE架构的计算-传输解耦合划分方法,使优化目标脱离冯诺依曼体系结构的束缚并进行重构。重构后的应用及算法具有更高的计算及访存并发性,更加适应DAE架构的访存及计算特征。相关工作从执行模型、优化手段、模型指导优化方法以及解耦合划分模型四部分展开,主要贡献及创新点如下:1)针对缺乏执行模型指导性能分析的问题,提出了一种基于DAE架构的程序执行模型。在理论层面指导程序员从带宽利用、多通道访存、计算访存比改进等多个方面对目标应用展开优化。该模型考虑处理器上的多层次存储结构特性,引入访存指令发射开销的概念。将计算访存比作为参数引入到程序执行模型,建立计算访存比与程序运行性能的关系。2)针对基础数学库与DAE架构硬件特性耦合性低的问题,本文以经典BLAS二级库函数GEMV作为研究对象,提出一种在该架构下加速访存密集型应用的高效算法。优化后的GEMV函数性能大幅提升。本研究工作以龙芯3B处理器作为硬件平台,针对GEMV访存密集型应用的特性,利用处理器访存部件加速该访存事务。使得GEMV的平均性能超过目前所有已公开的其他基于龙芯平台的版本。从而证明该方法可有效提升DAE架构下该类基础数学库的函数性能。3)针对DAE架构下优化工作开展效率低下的问题,提出了一种基于DAE架构的优化模式。首先提出一种分层的普通稠密矩阵乘算法,该算法每个层次间的耦合性较低,可以通过逐层优化的方式达到局部最优。其次利用DAE架构访存和执行单元分开的特点,通过插桩的思想在访存协处理器控制代码当中加入访存状态收集模块,引入一个运行时访存性能评价系统—DAEFS。通过利用DAEFS使4层稠密矩阵乘算法的其中两层具有自适应的特性,在运行时收集访存负载信息并自动调节算法的相关参数,改变算法的计算—访存关系并提升程序性能。4)针对应用程序计算与访存耦合性高、难以并发的问题,提出了一种针对DAE架构的数据解耦合划分方法。该方法将程序的执行流程划分成多个模块,通过有向图的方式表示模块间的数据依赖关系,并在此基础上利用基于启发式的有向图分簇算法对这些计算模块进行划分。具有硬件特征耦合性低、跨平台、易实现的特点。本文以Kepler架构GPGPU作为实验平台,对深度神经网络(DNN)算法进行数据解耦合划分。实验证明重构后的深度神经网络算法的并行加速比得到明显改善,从而提升算法在相关平台上的执行效率。

其他文献

浅析输血选择及输血反应应急预案

输血是临床上常见抢救患者的重要措施之一，为了保证安全、快速、有效地输血，输血的选择及观察输血反应尤为重要。现将经验与体会报告如下。

期刊

输血成份输血输血反应应急预案

我国云南省昆明市扶贫资金使用效率分析

为了解决我国农村贫困问题,扶贫开发也开始位列“十三五”规划十大目标任务之一。但是我国云南省的贫困工作面广程度深,扶贫资金使用效率低,本文主要以我国云南省昆明市为例,

期刊

扶贫资金项目管理使用效率对策

水稻响应重金属胁迫的蛋白质组学研究进展

水稻(Oryza sativa L.)是全球主要粮食作物之一,其重金属污染问题值得关注。综述了重金属胁迫对水稻造成毒害时所引起的蛋白质组学水平的变化情况。在现有的国内外研究进展中

期刊

重金属胁迫蛋白质组学水稻

几类图的关联图的边色数

给出了图Wn、Fn及Fm（n）的关联图I（Wn）、I（Fn）、I（Fm（n））的边色数。

期刊

图关联图完美对集边色数graph incidence graph perfect matching chromatic indices

影响门诊输液护患关系的因素及对策

门诊输液室由于患者多，工作量大，加之个别护理人员缺乏主动性等因素，易导致护息纠纷的发生。本文通过对门诊输液室16起护患纠纷进行分析，提出防范措施，现介绍如下。

期刊

门诊输液护患关系对策

探讨慢性重度乙肝抗病毒治疗的疗效

目的分析探讨对慢性重度乙肝患者实施抗病毒治疗的临床疗效，为临床提供参考。方法选取52例慢性重度乙肝患者作为观察对象，采用随机分组的方式将52例慢性重度乙肝患者分成两组，每

期刊

慢性重度乙肝抗病毒疗效

区块链社区:一种新型的组织模式

有限责任公司的出现实现了所有权与经营权的分离,但它同时也带来了委托代理问题。区块链社区是有别于有限责任公司的一种新型组织模式,这种组织模式实现了利益相关人与股东合

期刊

区块链公司治理委托代理共识机制

关于煤矿企业物资采购流程的优化分析探讨

物资采购是企业经营生产的一个重要环节,在一定程度上可以影响企业的经济效益。对煤矿企业来说物资采购具有重要意义。尤其在激烈的市场竞争环境下,物资采购可以决定煤矿企业

期刊

煤矿企业物资采购流程优化分析

浅析集团公司财务管理存在的问题及对策

引言:在实际工作中,由于集团公司经营多元化导致财务主体多元化,核算复杂多样化.这就使得集团公司财务管理难以发挥协同效益,极大降低了集团公司对外的协同性.笔者拟就此问题

期刊

薄壁深锥形制件旋压工艺研究

通过对风帽制件加工工艺进行分析,介绍了各种加工工艺的特点,根据旋压工艺特点,详细介绍了旋压毛坯的设计,选取合理的旋压工艺参数,保证了制件的尺寸精度要求。该工艺具有较

期刊

风帽旋压旋轮芯模

基于执行—访存解耦合体系结构的优化方法研究

与本文相关的学术论文