Infiniband网络中All_to_All通信性能优化

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:cyqlsc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  All_to_All 操作是一种重要的集合操作。本文通过实验研究了两种典型的All_to_All 算法在Infibinband 网络中的性能,发现这些算法在传输大消息时带宽利用率仅有30%-70%。分析发现这是由于网络中产生了严重的拥塞造成的。本文尝试通过将大消息拆分成小消息、调度小消息的发送来减少网络拥塞。实验结果表明该优化算法的带宽利用率可以达到80%。
其他文献
本研究从CFD 实际应用背景出发,综合多核与众核的特点,采用OpenMP 线程嵌套以实现CPU/GPU 的协同并行计算,实现了雅可比迭代法的GPU 加速以及OpenMP/CUDA 混合并行算法,并将其用于结构网格气动外流场的数值模拟.对单区200万结构网格数据,右端项、左端项矩阵及矩阵求逆、雅可比迭代等核心计算部分的GPU 并行分别取得了11.35、13.83 和8.34 倍的加速比,整个求解过程
资源分配策略是云计算研究领域中的一项重要研究点,研究人员提出了多种资源共享与分配策略,然而很少有工作关注不同云计算服务的用户群体的行为习惯对资源分配策略的影响.该文提出的基于用户行为特征的资源分配策略就是通过统计用户工作习惯与任务完成时间期望值在时间轴上的变化规律出发,建立用户行为特征信息表,从而预测出不同时间片内用户的任务提交规律以及用户期望完成时间,动态调整云计算环境中的资源分配策略,使得系统
由于多用户网络应用中存在的众多不确定性,当前的调度方法在动态性,实时性,适应性方面都不同程度存在不足。考虑到其实时性需求,提出了概率型调度的思想,压缩调度时间。该思想将任务的分配看作一个概率事件,而传统的调度是确定的。此外,概率型调度还具有对任务执行时间估计不敏感、性能稳定等所需的优势。基于该思想,以用户角度的最短响应时间为目标,给出了多用户网络应用的一个排队模型,并进一步将调度定义为一个非线性规
海量数据高性能计算蕴藏着巨大的应用价值,但是目前云计算体系只具有海量数据处理能力,不具有足够的高性能计算能力。本研究将具有超强并行计算能力的GPU与云计算进行融合,提出了基于CPU/GPU协同的异构高性能云计算体系结构。以开源Hadoop为基础,采用注释码的形式,对MapReduce函数中需要并行的部分进行标记。通过定制GPU类加载器将被标记代码转换为CUDA代码并动态编译运行。该平台将GPU的计
深度包检测(Deep Packet Inspection,DPI)是一种先进的包过滤技术,广泛应用于防火墙中。基于正则表达式的模式匹配算法已成为实现DPI重要方法之一,传统的正则表达式匹配算法的时间复杂度较高,不能实时进行网络安全的防护。为了提高正则表达式匹配算法的实时性,本文提出一种基于分布式存储的正则表达式匹配并行算法,该算法通过对数据进行步长计数,采用分布式存储,实现并行处理。通过实验分析,
云计算是一种新兴的计算模式,倡导一切皆服务.云计算由于能够共享分布在世界各地的计算资源,在大规模计算和数据存储中越来越受到重视.云计算是当前IT工业界、学术界研究的热点领域,云环境中的资源可用性已成为云计算不可忽视的问题.对于云计算,当处理器的处理速度不同,不是一直可用于计算时,可用性成为设计和发展云计算系统的关键需求.根据并行任务图的结构特点,讨论了影响并行任务可用性需求的关键因素,给出一种可用
近年来,功耗是处理器设计领域的关键问题之一.由于片上缓存占有了越来越多的CPU 芯片面积和功耗,本文提出了通过过滤不必要的缓存路访问来降低缓存动态功耗的方法.方法包括采用无效访问过滤器(Invalid Filter)来消除对含无效数据块的缓存路的访问;采用指令数据访问过滤器(I/D Filter)来消除对与访问类型(指令或数据)不匹配的数据块所在的缓存路的访问;以及采用tag低位过滤器(Tag-2
指令调度优化是编译器代码生成优化中最主要的部分之一。针对一些精简结构处理器核的特点,文中提出了一种基于多版本技术的指令调度优化方法,该方法根据对程序执行过程中的别名分析结果选择高效或者保守的指令调度版本去执行,克服了精简结构处理器在进行指令调度时静态信息获取不足的问题。
云计算是一种新型的计算模式,它将因特网上的数据、应用作为服务通过网络提供给用户。同时,云计算也是一种新的基础架构管理方法。它能够把大量高度虚拟化的资源组成一个庞大的资源池,统一管理。提供基础设施即服务。如何有效地管理虚拟资源,最大化使用率已成为当前云计算研究的热点。针对这一问题,本文总结了云计算平台(CCP,Cloud Computing Platform)的基础架构,讨论了几种流行CCP的系统架
深度包检测(Deep Pacekt Inspcetion,DPI)是网络入侵检测与防御系统(Network Intruison Detcetion and Prevention System,NIDS/NIPS)中的关键技术,如何快速而又准确的识别有威胁的网络安全事件成为近年来的研究热点,本文提出了一种基于CPU+GPU异构平台下的深度包检测系统,充分利用GPU的高性能的并行计算能力和高存储器带宽