基于代理模型的处理器结构设计空间探索技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:hsmk888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
处理器设计往往需要同时兼顾到性能和功/能耗指标,而这些设计指标之间又往往存在着相互冲突的关系。因此处理器结构设计优化一直以来都是处理器设计过程中的重要问题和难题。尤其是在当今纳米级的制造工艺下,一颗很小的处理器可以集成上亿个晶体管,其内部结构极其复杂,包含了众多结构参数。如何在由众多结构参数构成的指数量级的设计空间内,找到关于性能和功/能耗的同时优化的结构参数配置集合(帕雷托集合),是处理器设计人员面临的最严峻的挑战之一。面对如此巨大的结构参数设计空间,以及高昂的仿真实验代价,通过进行大量仿真实验和人工分析评估的方法,在时间上是不允许的。因此,一种快速、有效的处理器结构设计空间探索(design space exploration,DSE)技术变得十分重要和被迫切需求。  本文通过分析处理器结构DSE问题的特点和需求,提出了一种基于ACOSSO(adaptivecomponent selection and smoothing operator)代理模型的处理器结构DSE技术:通过仿真少量设计点,得到设计点处的处理器性能和功/能耗评估数据,并利用这些数据和设计点处的结构参数构建ACOSSO代理模型,然后利用与ACOSSO代理模型相结合的多目标期望改善(multi-obj ective expected improvement,MOEI)算法在整个设计空间内寻找关于处理器性能和功/能耗全局优化的结构参数帕雷托集合。  具体地,围绕实现该技术的各个方面,本文对代理模型的选择和构建方法,基于代理模型的多目标优化算法,基于MOEI准则的多点采样方法,以及用于配合DSE技术的事务级仿真平台建模技术进行了谈论。本文的主要贡献如下:  1)提出将ACOSSO模型作为代理模型,应用到基于代理模型的处理器结构DSE技术中。通过与领域内已有的几种代理模型在单核、多核处理器仿真平台下分别进行预测准确度的比较,实验结果发现,ACOSSO模型在两个仿真平台下的预测准确度均是最优的,从而验证了ACOSSO模型在处理器结构DSE问题中应用的适用性。其中,在以ANE(averagenormalized error)为预测误差指标的对比中,采用实验设计方法采集200点训练数据,并随机采集100点测试数据时,对于单核处理器仿真平台的4个标准测试程序,ACOSSO模型相对于其他代理模型的ANE指标平均降低0.620%~11.6%(性能预测)和1.35%~11.0%(能耗预测);对于多核处理器仿真平台的4个标准测试程序,ACOSSO模型相对于其他代理模型的ANE指标平均降低1.06%~9.75%(性能预测)和1.32%~10.0%(能耗预测)。  2)提出一种基于ACOSSO模型的MOEI算法(ACOSSO model based MOEI,A-MOEI),实现以较少的采样点数得到对结构参数帕雷托集合逼近程度较好且分布均匀、广泛的优化结果。在预测误差较大的区域内增加采样点,通常可以增加代理模型的预测准确度,扩大寻优范围。而从优化的角度,应该对预测得到的帕雷托点采样,以实现算法快速收敛。多目标期望改善算法框架通过对代理模型的预测不确定性进行建模,实现了对上述两种采样准则的平衡。本文通过推导ACOSSO模型的后验均方误差的计算公式,将其与MOEI算法相结合。实验结果显示,所提算法较其他几种领域内已有的基于代理模型的多目标优化算法具有更好的寻优性能。其中,在多核处理器仿真平台的4个标准测试程序下,采用实验设计方法采集200点训练数据,最大新增采样点数为50点时,A-MOEI算法较其他算法的GD(generational distance)指标平均降低0.0318%~0.187%,IGD(inverted generationaldistance)指标平均降低0.034%~0.122%,NHVR(normalized hypervolume ratio)指标平均提升0.553%~2.24%。  3)为了实现并行肘比量采样,以降低实验代价,本文对A-MOEI算法的多点采样方法进行了研究,并提出了双层循环采样、根据空间分布采样和增强预测与多峰采样相结合的多点采样方法。实验结果显示,将增强预测采样和多峰采样相结合的多点采样方法可以以较小的优化性能损失代价,实现上述目标。其中,在多核处理器仿真平台的4个标准测试程序下,采用实验设计方法采集200点训练数据,最大新增采样点数为50点时,该多点采样方法较原A-MOEI算法在优化性能上的平均损失代价为:GD指标损失0.0562%,IGD指标损失0.0703%,NHVR指标损失0.0775%,但是实现了5倍的并行仿真提速。  4)研究了以系统层处理器结构优化为应用背景的事务级仿真平台建模方法。系统层的处理器结构优化对仿真平台的要求是:要提供足够精度的功能模型和设计指标评估模型,以及能够被接受的仿真速度。基于VPU模型的处理器事务级模型可以达到上述要求。本文对一种基于SystemC TLM2.0技术的VPU仿真平台建模方法进行了研究,并提出了一种基于Python脚本进行仿真控制和调用DSE算法程序的方法。  5)将本文提出的基于ACOSSO代理模型的处理器结构DSE技术应用到了一个系统层处理器结构优化的实例中,并进行了实验评估。本文采用基于SystemC TLM2.0技术的VPU建模方法,对一个包含功耗管理模块和共享DDR的总线型CPU+GPU异构多核目标处理器结构进行了系统层建模,并以一个H.264视频编码程序为目标应用,采用所提的基于ACOSSO代理模型的DSE技术对该目标处理器的结构进行了优化。实验结果显示,本文所提的DSE技术在该实例应用中的应用效果较好,从而进一步验证了本文所提DSE技术的有效性。  本文将提出的基于ACOSSO代理模型的处理器结构DSE技术在不同抽象层次以及不同仿真平台下的结构优化中,进行了验证、评估和应用。实验结果充分证明了该技术的有效性和高效性。本文对于处理器自动化设计方法学中的相关理论研究做出了贡献,所提方法也将在中国科学院计算技术研究所动芯系列处理器的结构优化工作中发挥重要作用。
其他文献
目前,具有环境感知能力的智能应用日益丰富,作为其感知信息来源的无线传感器网络需要向不同的应用提供数据支持。智能应用往往只需要一部分传感器网络采集到的数据,如果简单
随着嵌入式计算技术、无线通信技术、传感器网络技术和自动控制技术的快速发展与日益成熟,物联网技术应运而生。物联网技术作为连接物理世界和信息世界的纽带,正在受到越来越广
随着互联网技术的飞速发展,越来越多的企业和个人开始倾向于在互联网上以Web服务的形式发布信息。如何检索这些信息变得尤为重要。传统的搜索引擎因为搜索结果大都局限在HTML
互联网、移动互联网与物联网的高速发展所导致的日益激增的数据量给各大企业带来前所未有的挑战,以往占主导地位的传统关系型数据库在数据写入能力、存储能力、计算能力与系统
在移动互联网高速发展的今天,各种类型的网络业务迭代越来越快,同时,OTT(Over The Top)业务的兴起,更是快速地将运营商管道化。面对日益被动的局面,网络功能虚拟化(Network Functi
学位
工作流是企业自动化办公软件中的核心模块。随着各行业信息化的推进,需要办公软件支持的业务也越来越复杂。因此,对工作流的综合要求也越来越高。工作流事务异常直接影响着系
移动通信产业和互联网产业的迅猛发展,使得移动通信和互联网已成为人们日常生活中不可或缺的重要组成部分。随着我国3G移动网络的快速部署与业务应用,移动互联网时代已经来临
web口令面临暴力破解的威胁。一方面,大量的web口令带来的记忆负担使人们倾向于选择弱口令。另一方面,口令破解手段不断提高对口令安全产生了实质性的威胁。研究能够抵抗破解的
移动自组织网络(Mobile Ad Hoc Networks, MANETs)是一种由若干无线通信功能的移动节点构成的临时性网络,无需依赖固定基站便可即时组网、随时通信,它可广泛应用于军事通信、