【摘 要】
:
多尺度现象及相关理论方法是复杂物质系统研究中重要的科学问题。传统的量子力学或分子动力学方法都难于处理多尺度体系中存在的现象。第一原理离散变分线性标度(DVM-DAC)算法是一种有效的大尺度体系计算方法。它采用分而治之的方案,获得了O(n)的计算复杂度。但由于计算规模及材料复杂性等因素,在实际研究中依然存在相当的计算瓶颈,难以满足大尺度物性研究的需要。发展了一种基于DVM-DAC的混合粒度并行算法并
【机 构】
:
Tsinghua National Laboratory for Information Science and Technology,Beijing,100084
论文部分内容阅读
多尺度现象及相关理论方法是复杂物质系统研究中重要的科学问题。传统的量子力学或分子动力学方法都难于处理多尺度体系中存在的现象。第一原理离散变分线性标度(DVM-DAC)算法是一种有效的大尺度体系计算方法。它采用分而治之的方案,获得了O(n)的计算复杂度。但由于计算规模及材料复杂性等因素,在实际研究中依然存在相当的计算瓶颈,难以满足大尺度物性研究的需要。发展了一种基于DVM-DAC的混合粒度并行算法并付诸实现,有效地解决了原有算法的计算瓶颈问题。实验结果表明,混合粒度并行算法获得良好的计算效率,处理1158个金属原子体系获得11倍以上加速比,为大尺度体系复杂金属研究提供重要工具。
其他文献
目前基因拼接软件中应用最广泛的技术是基于De Bruijn图的基因拼接算法.随着第二代基因测序仪的大量使用和基因测序在工业中的广泛应用,常常需要对长达数十亿bp长度的基因组测序数据进行处理.针对海量的基因测序数据,快速、高效和可扩展的基因拼接算法变得非常重要.虽然已出现了一些并行拼接算法,如YAGA,开始研究这些问题,但是拼接过程中时间空间消耗较大的构图和单链化简这两大步骤在海量数据的挑战下仍然是
计算机系统的能耗已经成为一个越来越严重的问题.功耗监测是理解能耗问题的基础.本文提出了一种直接测量计算机CPU、内存、磁盘等部件功耗的方法.利用设计的部件级功耗监测系统,获得了SPEC CPU2006、PARSEC 3.0等基准测试程序的细粒度部件级功耗数据,为进一步的能耗研究奠定了基础.
图数据划分方案的优劣是提升并行算法计算效率的重要因素。本文面向GPU程序,定义了一套性能参数和图数据显示参数,为CUDA程序员开发了可视化交互平台,用于交互式调整参数,探究程序性能与数据划分方案之问的关系。该工具针对GPU异构体系结构下的CUDA程序对数据凝聚性读写的特殊要求,对数据以块为单位着色和标号显示,帮助程序员通过观测图的整体布局,调整数据划分控制参数,优化分块效果。在系统实现方面,采用J
计算机体系结构设计同时具有艺术性和工程性。片上多核处理器为新型计算机体系结构的设计提供了机遇为了使构思有线索可循,本文给出了基于多核处理器的计算机体系结构构思的对立统一模型,它是体系结构设计思想和方法的模型,而不是一种关于某种具体结构的设计结果。其中从对立统一的观点探讨了多核处理器对计算机体系结构的影响,应用、工艺和体系结构之间,多核CPU、FPGA、GPU之间,多发射、流水线、Cache、乱序执
数据挖掘并行算法,应该以不牺牲挖掘效率和挖掘质量为前提。通过对数据挖掘原理和并行化的深入研究,在考虑到挖掘效率,负载平衡,运行环境,节点状态等多方面因素的基础上,提出了一种新的基于动态调度的数据挖掘并行算法,该算法以规模较小的子数据集为并行挖掘单元,各个并行单元之间采用全局通讯模式—Master-Worker模式来进行互相通信,降低了并行挖掘的通信成本,提高了挖掘的效率,缩短了挖掘的时间,同时该算
通过将Orthodir(m)算法两个向量内积改成几个连续内积,改变算法数据相关性,提出了改进的Orthodir(m)算法(IOrthodir(m)算法)。改进的算法具有与原算法相同的收敛性。理论分析当处理器数目达到一定数量时IOrthodir(m)算法计算速度快于原算法,扩展性方面也要优于Orthodir(m)算法。同时实验表明IOrthodir(m)算法优于Orthodir(m)算法。
学科研究热点对科研工作者具有重要的指导作用。常规的学科研究热点检测方法面临检测成本高、检测信息相对滞后等问题。为此本文提出一种基于学术会议征文的学科研究热点检测方法,并借助CNKI学术趋势对其进行评估。实验结果表明该方法是有效可行的。
开发了一个高效率和易扩展的基于GPU(图形处理单元,Graphic Processing Unit)的并行分子动力学模拟程序.程序能够在GPU 上处理固相共价晶体中原子间的多体相互作用.通过测试,开发的代码在Mole-8.5 和天河-1A 上都取得了良好的并行效率和优秀的浮点操作性能.可以预计,晶体硅的大规模分子动力学模拟在计算其宏观性质、表界面现象和反应沉积方面具有巨大的应用潜力.
借鉴无损压缩编码中的GAP和GED预测器模板,改进该模版并应用在图像边缘检测中,提出一种新颖的基于多方向梯度边缘预测器(MGEDP)模板的动态阈值控制的边缘检测算法。以图像中心划分四个区域,采用并行技术同时多个方向应用MGEDP预测器模板,分别预测错误值;利用错误反馈信息构建预测误差图像;然后利用大津算法(OTSU)计算阈值;分类误差图像边缘;细化边缘,最后合成边缘图像。实验证明,该算法应用并行技
本文提出一种并行编程语言CC$,尝试解决分布式众核并行计算机的编程困难.CC$的编程模型以Multi-BSP模型为基础,将分布式众核并行计算机的硬件架构抽象为三层.数据按照存储的层次和共享范围分为五类,以便在不同层次上提供共享.CC$还提出一类虚拟指令解决不同层次之间的数据交换,实现数据访问的逻辑化描述.并行程序按照三层Multi-BSP超步嵌套执行.测试表明,CC$程序的运行效率高,易学易用,大