非规则计算中的局部性和并行性

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户：oyfj2009

【摘要】

：

非规则计算是许多重要科学应用的主要的问题，计算流体力学、计算分子动力学等经典计算科学中的非规则计算问题已经成为高性能计算重要的挑战性问题并得到广泛的研究。目前生物

【作者】

：

谭光明

【机构】

：

中国科学院计算技术研究所

【出处】

：

中国科学院计算技术研究所

【发表日期】

：

2007年期

【关键词】

：

非规则计算动态规划图遍历算法局部性并行性

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

非规则计算是许多重要科学应用的主要的问题，计算流体力学、计算分子动力学等经典计算科学中的非规则计算问题已经成为高性能计算重要的挑战性问题并得到广泛的研究。目前生物信息学和计算社会学等新兴的计算科学逐渐成为高性能计算应用的重要课题，而这类应用中最明显的特征就是大量的非规则计算。非规则计算问题表现为算法和程序的计算依赖关系和访存模式的非规则，从而其局部性和并行性受到限制，而且随着计算机体系结构向大规模片上多核、更深存储层次的方向发展，使得对非规则计算问题的局部性和并行性挖掘问题变得尤其突出和更加重要。　　本论文围绕生物信息学和计算社会学中两个重要的核心算法—动态规划和图遍历算法—在现代高性能计算机体系结构上展开如何开发局部性和并行性方法的研究。结合计算机体系结构特异性和多样性的特点，论文首先提出在高性能计算机上分析和设计高性能算法的基本方法、框架和模型，然后针对不同的体系结构提出了有效的策略优化动态规划和图遍历算法的局部性和并行性，同时给出了全面系统的性能评价，是国内外首次在类似IBM Cyclops64众核体系结构上的高性能算法研究。其中主要工作包括：　　 ●系统总结了Cache存储层次体系结构的高性能算法设计模型和方法，结合体系结构向多核发展的趋势，提出了一种新的并行算法设计技术-延迟容忍模型。　　 ●分析动态规划算法中的计算依赖关系，设计了一种新的数据依赖关系转换策略，变换后的依赖关系更加适用于改善计算中局部性和并行性。　　 ●对变换计算依赖关系后的动态规划矩阵分块，采用分而治之的方法，首次提出了一种Cache无关算法用于计算动态规划矩阵，并证明了其Cache复杂性是最优的。　　 ●大规模机群系统和多核代表了两种高性能计算体系结构的主流，网络延迟和片外存储访问延迟分别是大规模机群系统和众核体系结构的性能瓶颈。基于提出的延迟容忍算法模型，设计的并行算法获得了计算和通信、计算和存储访问的重叠，有效地隐藏了网络通信和片外存储访问的开销，从而提高并行算法在曙光4000和IBM Cyclops64上的可扩展性。　　 ●大规模图分析问题中的典型实例是图遍历，由于其极少的局部性/数据重用、动态非连续存储访问和细粒度并行的特点，很难在通用的体系结构上获得高性能，甚至会出现负加速比。在新的众核体系结构上，提出构造非规则存储访问中即时局部性的新技术，并基于延迟容忍模型隐藏构造局部性开销。同时，利用开发的并行性和体系结构支持的细粒度同步减少同步开销。在IBM Cyclops64160核平台上的实验结果证明了新的优化技术的有效性，其性能也优于其他多线程体系结构如Sun Niagara和Cray MTA-2。

其他文献

高可靠微处理器结构研究

不断进步的半导体工艺和不断变化的应用需求一直是推动微处理器发展的主要动力。一些工艺技术如缩小器件尺寸、降低工作电压和提升工作主频，在提高处理器性能的同时，却使得处理

学位

嵌入式微处理器瞬态故障故障注入容错技术

多示例学习与多标记学习的研究

监督学习是机器学习领域研究得最多、应用最为广泛的一种学习框架。在该学习框架下，每个对象由单个示例表示并对应于单个概念标记。一股认为，基于传统监督学习框架描述的学习问

学位

机器学习多示例学习多标记学习监督学习

客运专线运营高度系统中列车跟踪技术的研究

客运专线运营调度系统是客运专线运营管理、调度指挥和列车运行控制的中枢，而列车跟踪定位系统是客运专线运实现安全、正点、高效和运力资源有效利用的重要保障。本课题的目标

学位

客运专线定位系统列车跟踪运营调度

基于AOP与反射机制的软件自适应研究与应用

随着软件技术的不断发展,软件的应用已涉及到方方面面、各行各业,软件的规模与复杂性也不断增大。普适计算、自主计算等新型计算模式的出现,使软件面临的挑战也越来越多:软件

学位

软件工程AOP反射机制自适应软件

基于频繁项集的海量文本聚类研究

文本的自动化聚类是文本数据的分类处理和自然语言处理中的一项关键技术,在文本文献的自动分类中也是一项非常重要的应用。近代以来,大量的科技文献的的不断涌现,也导致文本

学位

文本聚类频繁项集关联分析Hadoop

面向会议场景的个人通信服务管理系统设计与实现

随着智能终端设备、通信网络和多设备传感技术的不断发展,在上下文感知的学术会议场景中,对于参会用户上下文、时间上下文、位置上下文、当前上下文和学术会议论文等数据进行

学位

Hadoop学术会议场景分布式推理分布式推荐文本相似度

基于数据共享的就业信息模型研究与实现

实现信息共享是企业信息化管理的基本要求,因此构建一个标准和完备的共享信息模型是进行企业信息化管理和业务系统运营的关键之处。当前就业领域分散的业务系统繁多,数据冗余

学位

NGOSSSID模型信息共享就业信息服务

多跳无线传感器网络时间同步技术研究

无线通信、微机电系统(Micro-Electro-Mechanism System，简称MEMS)以及传感器技术的发展孕育了无线传感器网络(wireleSS Sensor Networks，简称WSN)这一新的计算模式。时间同步

学位

晶振频率偏差时间同步无线传感器网络同步精度同步精度稳定性

基于WEB的嵌入式设备远程无线管理与监控系统

目前,嵌入式计算机是信息产业新的经济增长点,是振兴我国信息产业新的突破口。随着嵌入式市场的不断扩大,市场对嵌入式系统的安全性、可靠性、可维护性和生命周期都提出了更

学位

嵌入式系统LinuxGPRSEWS

基于图形化的资源分配研究与实现

现今生产生活组织形式和步骤日益复杂化,多元化,差异化,对合理进行资源分配提出了更高的要求。引申出的资源分配问题就是研究对有限资源合理利用,进行优化配置,取得最理想的

学位

机位分配粒子群算法图形化动态分配

非规则计算中的局部性和并行性

与本文相关的学术论文