并行对称矩阵三对角化算法在GPU集群上的有效实现

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:yeyeh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对称矩阵三对角化是求解稠密特征问题的关键计算过程.针对GPU集群采用了MPI(message passing interface)和GPU级2级并行方法设计实现了基于MPI和CUDA(compute unified device architecture)的稠密对称矩阵三对角化算法.在MPI集群级并行中,通过将2维通信域中行列通信域间的全局数据通信设计为完全并行的点点数据通信方式,改善了三对角化MPI并行算法的通信性能.通过改进原矩阵三对角化的MPI并行算法,避免了在GPU级并行中使用的不规则的矩阵向量运
其他文献
介绍一种新型工程船舶-双体打桩船的设计,可满足港口和近海打桩作业的需求。与普通打桩船相比,双体打桩船具有较好的稳性和操纵性,可适应多种作业环境。在双体打桩船总布置完成
当代小剧场话剧中舞台布景转向当代生活的真实场面,演员将在与生活一样真实的布景里表演,一个生活在我们日常生活中的现代人的朴实姿态和自然动作。现代小剧场话剧越来越强调
深基坑支护系统的位移与变形不仅关系到基坑本身的安全问题,也影响到周边环境的安全。针对当前在各行业、地区性规范中,仅依据基坑等级、开挖深度等进行基坑分级,且基坑水平
世界航运和港口吞吐量是世界经济的晴雨表。进入新世纪以来,世界经济强劲复苏,全球贸易额快速增长,为国际航运业尤其是集装箱运输带来了强劲的需求。在作为世界制造中心不断高涨
组织创新氛围是组织成员感受到的来自组织层面的对创新的支持程度。文章从组织鼓励、资源供给、领导支持、团队运作和员工发展五个维度构建了组织创新氛围评价指标体系,建立
在建筑结构设计中,涉及到的专业很多,各个专业之间应进行相互的配合,这样才能确保建筑结构建设项目顺利的完成。本文笔者将结合具体的建筑结构施工图设计实例,简要探讨结构专
人到中年,不易感动,但今年春节期间读白忠德先生的《回望农民》,我一次又一次地冲动着、感慨着。我不止一次地给妻子儿女以及前来造访的亲友讲述着忠德先生作为一个脱离农村的城
“谦”是中华民族重要的传统美德。《易经》的《谦》卦以及《易传》对谦德的阐发在谦德思想史上具有重要的地位,后代对谦德的阐发多借助《周易》相关思想资源。《周易》谦德
目的:观察急性中心性浆液性脉络膜视网膜病变(central serous chorioretinopathy,CSC)荧光渗漏点近红外自身荧光(near-infrared fundus autofluorescence,NIR-FAF)的图像特征
<正> 我局有CY和CY3—Ⅱ型液压操动机构10台,在十几年的运行中,大、小修进行了20余次,充氮时阀系统遇到的麻烦不多,至多是换一换充气阀尾部的橡皮条。而1994年6月大修的两台