高通量众核并行模拟加速技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:liang630223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据应用日益普及,数据规模高速增长,对处理器性能提出巨大挑战。高通量众核处理器在运行速度、单位面积能耗以及扩展性方面的改进成为计算机体系结构领域的研究热点。由于芯片制造工艺复杂、成本高昂,软件模拟器作为体系结构研究的重要工具在研究的许多阶段中都发挥着非常重要的辅助作用。软件模拟器最重要的评价指标是模拟速度,尤其是在大规模众核结构模拟中,提高模拟速度至关重要。本文详细地分析了现有的模拟器加速技术,并将其归类为提高单条指令或指令块模拟速度的技术、减少被模拟指令数量的技术以及利用硬件平台的并行性和提高模拟算法的并发度的技术。在此基础上,本文提出以下两个方案进行对高通量众核处理器的模拟进行改进与优化。(1)基于优化单条指令或指令块的思路,本文提出使用查找表方法对指令译码进行加速。由于宿主机上拥有相对充足的内存资源,故可以将模拟器运行过程中需要反复进行的一些计算预先完成并将结果以表的形式保留在内存中,以后遇到同样的计算时,只进行一次查表操作即可。本文对译码过程中遇到的PopCount问题、条件域检查以及踪迹缓存等方面使用查找表技术进行加速。查找表技术的引入既提升了指令译码的模拟速度,又使得编码实现更加简洁灵活。(2)基于利用硬件模拟平台并行性和提高模拟算法并发度的思路,设计实现了从多个角度优化的并行离散事件模拟框架。首先,模拟框架采用随机映射的事件调度算法,显著提高了模拟过程中的负载均衡性;其次,框架采用cycle-by-cycle的时间推进算法消除了CMB同步算法中高额的同步开销,这得益于以红黑树结构对事件队列的管理;同时,框架基于单写者单读者模型实现未来事件队列的无锁化,避免了事件调度过程中的大量锁开销。最后,在模拟过程中,大数据负载中海量的离散数据访问请求表现为组件频繁的内存操作,本文选择内存池方案对其进行管理。内存池方案以少数几次大规模内存分配代替频繁的小规模内存申请和释放,回避了动态内存管理方案固有的操作延迟,内存操作效率提升显著。代表性的大数据应用包括单词计数(WordCount)、T级数据排序(TeraSort)以及模式匹配(KMP)被用于本文加速方案的性能评估。实验结果表明查找表方案将PopCount问题解决速度提高26.14倍,并行离散事件模拟框架的优化将总体性能提升3.94倍。
其他文献
增强现实(Augmented Reality, AR)是一种将计算机产生的虚拟物体或信息与真实环境进行合成并对景象加以增强或扩充的技术。文中介绍了增强现实的基本概念、主要应用及研究现
产品信息模型是协同设计过程控制与管理的基础。它是用以表达协同设计对象的结构、组织、约束及属性的功能体。由于在协同设计中,不同领域的设计群组人员所具有的领域知识不同,在产品设计过程中,会对产品的概念产生歧义性,引起设计的冲突。如何构建统一完备的产品信息模型,已经成为协同设计的首要任务。目前对于产品信息的建模均是基于语法层面的描述,无法表达基于语义层面的信息要素。而本体论以其良好的语义表达能力和具有对
随着计算机技术的高速发展,计算机系统已经广泛运用于水务行业的各个方面,经过多年的运行,水务行业在各个业务系统存放了大量的历史数据。如何利用这些“沉睡”的数据进行数
自动图像标注是解决人工标注问题的具有挑战性的工作,它试图在高层语义特征和底层视觉特征之间建立一座桥梁。特别随着机器学习理论的不断发展,很多学者设计出了不同的学习模
需求识别是需求工程中非常重要的阶段,是发现目标系统所提供的需求相关的活动,在软件开发中是构建后续阶段的基础。需求识别是处于或接近软件工程过程的开始阶段。当开始阶段出
求直线方程是解析几何中的基本题型,熟练地求直线方程是学好解析几何的基础.本文介绍几种求直线方程的常用方法.一、公式法例1已知△ABC的三个顶点A(-4,-3),B(0,3),C(2,0),求
随着位置服务的迅速发展,室内定位在许多领域应用广阔,比如商场购物导航推荐、停车场停车寻车、老人健康防护、展厅自助导航、企业智能制造和矿井救援等。由于室内环境复杂多
在图像处理中,需要大规模计算和数据处理。目前,数字图像处理速度还无法满足实时性的要求。为改善这种情况,人们在图像处理中引入了并行计算技术。并行计算技术是在传统的串行计
在解答许多恒成立、恒过点、恒定值等问题上,我们常引导学生先寻特例,在特殊情况下,考察研究目标,经类比、归纳,猜想,找到解题的方案.例1(2011南昌市高三第二次模拟测试卷数
随着网络的迅速发展,对复杂网络的研究在许多领域都备受关注。社区结构是复杂网络的一个普遍特征,对社区结构的挖掘成为了网络分析中的研究热点。复杂网络由许许多多个社区构