高效能并行编程的挑战及评价研究

来源 :2013全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:liongliong482
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文分析了高端高效能计算系统体系结构正在经历的重大变革以及呈现的多个显著特征,以及由此带来的功能复杂性和性能复杂性的加剧给并行编程带来的挑战,论述了为适应体系结构的发展趋势,高效能并行编程模型需要具备的特征和需要解决的问题.为了对高效能并行编程模型的高效能特性进行有效的评价,本文还提出了针对高效能并行编程语言、编译器和运行库的评价指标和评价内容,涉及易编程性、高性能、可扩展性、高可用性和低功耗,五个方面.
其他文献
文章介绍了C网RRU直流远程供电方案和典型应用,重点分析了RRU直流远供人身安全性,最后将RRU直流远供与其他供电模式进行对比,总结出RRU供电保障的忧先级和最优模式.
文章阐述了接地系统高频抑制器类防雷产品的防地电位反击工作原理,通过建模测试,该类产品相对于传统的接地方式在防护效果上具有的明显优势,并指出了安装、维护时的一些注意事项.同时选取主流设备厂商生产的接地系统高频抑制器,从原理分析、建模测试及试用效果等3个方面剖析该类产品的实际防护效果。
文章针对当前GSM/TD-SCDMA双网并存、业务互补的需求,提出自适应传播模型及网格化覆盖和业务分析方法,以GSM/TD-SCDMA双网业务均衡为目标,联合覆盖和业务进行规划优化仿真,实现GSM/TD-SCDMA双网多层业务均衡和智能布点,充分发挥双网业务承载能力,达到双网融合规划和优化的目的,从而提高无线规划优化工作科学性和工作效率。
随着各行各业视频监控需求的不断提升,传统的有线监控模式在许多场景下已经不能满足企业的要求,必须使用无线监控方式.文章以中国电信C+W双网覆盖为前题,重点分析3G白名单及建筑工地视频监控复杂无线环境下无线组网方式,结果表明无线监控安装快速、灵活性强、性价比高、末端无需管道线路等特性,使得越来越多的行业监控系统采用了无线的组网方式,建立监控点与监控中心的连接。随着WiFi技术标准的不断更新成熟、3G网
文章主要针对WCDMA双载波扩容之后的邻区优化进行了研究,阐述了双载波环境下邻区关系的演变过程,邻区的配置策略,同时总结出"先加后删"的邻区配置和优化方法,取得了良好的优化效果。
文章在尽量不修改802.16j标准协议的情况下,提出一种新的管理802.16j中继业务方法,以减小业务管理信令开销、等待时间等.该方案虽然资源预留隧道会以一定的资源浪费作为代价,但可以减少重要信令的开销和延时,对于中继多跳系统来说还是值得的;同时,它无需对网络协议框架进行较大的改动。
针对传统协同过滤推荐(Collaborative Filtering Recommendation,CFR)受数据聚类预处理、评分矩阵稀疏性影响较大和多个评分矩阵之间不能知识迁移的问题,提出一种基于联合聚类和评分矩阵共享的协同过滤推荐方法,以提高推荐系统精度和泛化能力.该方法首先通过联合聚类对原始评分矩阵进行用户和项目两个维度的聚类;然后对评分矩阵进行分解并取得共享组级评分矩阵;最后利用共享组级评
在很多应用中,模板计算(stencil)是最为重要和耗时最多的计算核心.随着越来越多的超级计算机开始使用多核CPU和众核协处理器,如何在这样的平台上将stencil优化至较高的性能和效率便成为了一个亟待解决的问题.在本文中,选取了7点Jacobi、13点浅水波方程和19点有限差分三个典型stencil进行研究.通过对这3个stencil在不同平台上的优化和分析,探讨了不同的体系结构对于性能和效率产
HPC上搭建虚拟集群可以较好地实现资源复用且可定制,同时保证各个用户需求并不会产生资源冲突.被认为可以解决高性能计算面临的诸多问题的潜质,同时其主要面临的问题是额外的性能开销.为了验证虚拟化在高性能计算中应用的可行性,本文在高性能计算集群中构建了虚拟化系统环境,并针对MPI类应用进行了系列对比测试.实验结果显示,NPB测试中,LU和SP在虚拟集群上运行时间更长,IS、MG、CG、BT在16节点的集
基因组数据在以空前的速度增长,其中,多数基因组数据文件格式以类似于表格的平文形式存储.为了合理利用资源,开发了一个基于GPU加速的基因组数据压缩框架.该框架包含了多种压缩算法在GPU上的高效并行化实现,通过为列数据选取合适方法进行压缩,在不损失压缩率的前提下,压缩速度和解压速度同时达到约100MB/s.同时本文设计了一种适合GPU加速的基于Markov模型及字符变换的压缩方法,测试结果表明该方法在