【摘 要】
:
中国科学院地球系统模式CAS-ESM成功实现了IAP AGCM4.0与WRF的单向嵌套,但其计算时间急剧增加,并行效率有待提高.因此,本文开展了基于二维剖分对大气环流模式IAP AGCM4.0进行并行优化的工作,研究了IAP AGCM4.0通过耦合器CPL7与WRF单向嵌套的并行机制,并提出了解决METGRID并行负载不均衡问题的优化算法数值试验表明:并行优化后的IAP AGCM4.0具有较高的并
【机 构】
:
中国科学院 计算机网络信息中心 超级计算中心,北京 100190;中国科学院大学,北京 100049
论文部分内容阅读
中国科学院地球系统模式CAS-ESM成功实现了IAP AGCM4.0与WRF的单向嵌套,但其计算时间急剧增加,并行效率有待提高.因此,本文开展了基于二维剖分对大气环流模式IAP AGCM4.0进行并行优化的工作,研究了IAP AGCM4.0通过耦合器CPL7与WRF单向嵌套的并行机制,并提出了解决METGRID并行负载不均衡问题的优化算法数值试验表明:并行优化后的IAP AGCM4.0具有较高的并行效率,METGRID优化后,64核计算时METGRID和REAL部分的计算速度能提高大约7倍在对美国南部大平原2000年3月气旋形成事件的模拟计算中,整体计算速度提升了218.23%最后对CAS-ESM进行了不同CPU核数的数值模拟,模拟结果表明:IAPAGCM4.0与WRF的嵌套具有比较理想的并行性能和较强的可扩展陛,256核时并行效率高达45.5%.
其他文献
传统的协同过滤算法存在准确率较低以及计算延时性问题,本文提出一种基于标签与协同过滤的并行推荐算法:通过计算标签的TFIDF值,降低流行标签的权重,根据用户的历史行为预测用户对其他资源的偏好值,最后依据预测偏好值排序产生Top-N推荐结果.论文不仅在理论上对算法的计算效率与复杂性进行了分析,而且通过MapReduce实现了该算法,并在实验中与Mahout的协同过滤算法进行了对比分析,实验结果表明在该
本文对描述多相流流体运动的格子玻尔兹曼方法(LBM)进行了并行优化.根据LBM高度并行性的特点,采用消息传递并行机制实现了LBM并行程序,并通过多线程并行优化手段,实现了该程序的MPI+OpenMP混合并行.在LBM并行程序的基础上,针对程序的强可扩展性对总问题规模为400*400*400在多组进程上进行了测试,由两组测试结果可以看出程序的性能热点部分所得加速比接近理想加速比,体现了LBM程序良好
OpenFlow采用数据平面与控制平面分离的架构,由软件实现的OpenFlow控制器对网络进行集中控制.这种分离架构中由于交换机需要和控制器进行交互,因此必然产生一定的时间开销.本文实验表明数据流建立过程中的信息交互导致数据包传输延时至少增长2倍,严重降低网络性能.由此,量化分析OpenFlow网络中流建立开销具有重要意义.本文分析流建立开销产生的原因,并对导致数据包传输时延增长的影响因素进行量化
末级Cache对于多核处理器具有至关重要的作用,研究目的是对末级Cache的结构及使用策略进行优化,以提高多核处理器的性能.以8核处理器为研究对象,提出了一种基于内核分组的Cache结构,该结构将8个内核分为4组,将末级Cache资源分为固定私有Cache,动态私有Cache以及动态共享Cache,并给出了相应的结构布局与动态划分策略,以保证尽可能小的访问延迟以及尽可能大的Cache利用率.基于全
本文提出了一种基于信息内容保护的信息安全模型.该模型利用将汉字笔画抽象为有向图的方法,设计了汉字笔画图抽象的具体方案,实现了对汉字字形结构的动态描述:建立了动态汉字字形描述库,设计了汉字字形的生成算法,实现了汉字字形的Web存储和在客户端的特征字形的输出.为汉字信息的云端存储和云端数据安全性保护提供了一种解决方案.
BH树算法的并行实现和应用是N体问题的研究热点.本研究重点以MPI和OpenMP混合编程模型实现了BH树算法的并行,并采用正交递归二分法(ORB)实现进程间的负载均衡,并行后的代码在双路CPU上获得了20.6倍的性能提升.同时,将并行后的代码移植到CPU多核和MIC的异构平台上,利用CPU和MIC协同计算、cache优化等技术进行优化,优化后的异构平台上单节点性能相当于双路CPU的1.4倍,且具有
复杂网络的可视化是复杂网络研究中的重要手段.近年来也有很多学者致力于对布局算法的改进[1],但是大多数改进算法都是只针对布局效果或计算效率的其中一个方面.随着Web2.0时代和大数据时代的来临,作为研究对象的复杂网络的规模越来越大,这对复杂网络可视化布局算法的布局效果和运算速度都提出了新的挑战,因此,本文主要研究大尺度网络如何在有限的显示面积中快速合理的显示的问题,指出较大规模的网络数据,即使压缩
本文提出了一种支持海量存储系统的高性能通信协议.链路负载均衡机制,针对链路负载情况和权重进行评价并选择:链路容错机制,结合退避算法和P坚持算法实现基于超时机制的链路监测和恹复机制,与简单超时机制相比,至少提升10%性能:消息重传确认机制,采用滑动窗口机制缓存请求信息标识符和应答消息,仅处理对系统产生影响的写操作,避免读操作产生的大量数据对内存的消耗,相比较NFS的重复请求高速缓存而言,减少缓存信息
随着数量巨大的云服务的涌现,云服务选择成为云计算领域的重要研究内容.云服务本质上是Web服务,服务选择不仅与QoS相关,也与Web服务数据的可信性相关,即与Web服务输出数据的可信性相关.本文在当前Web服务选择研究的基础上,从数据起源角度衡量Web服务输出数据的可信度,并将Web服务输出数据的可信度与QoS数据结合,提出一种基于skyline计算的Web服务选择算法,对Web服务进行筛选和评判,
作为图论经典问题之一,全源对最短路径(All PairShortest Path)问题计算图中所有顶点对之间的最短距离,在生物信息学、地理信息系统、集成电路计算机辅助设计和交通规划等领域都有重要应用.Toueg算法是基于Floyd-Warshall算法的分布式算法.本文在Pregel上实现了Toueg算法,并且针对图论问题通信量大、计算量少的特点,本文提出一种改进的Toueg算法,Communic