多CPU多核系统上的并行预处理算法

来源 :中国工程物理研究院 | 被引量 : 0次 | 上传用户:cnsdxl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
求解大型稀疏线性代数方程组是科学与工程计算主要的基础计算问题之一,其性能优劣往往影响到整体数值模拟的效率。目前在世界上最高性能的前五百台并行计算机中,超过九成的使用了多核架构。因此研究适用于多核架构并行机的大型稀疏线性代数方程组并行求解算法具有重要的现实意义。大型稀疏线性代数方程组求解算法通常由两个方面组成:矩阵向量运算和向量校正。并行计算机体系结构越来越呈现出多级化特点。目前比较常见的体系结构是机群-节点-CPU-核。在这种体系结构下,节点间的通信代价比较昂贵,而CPU内各个核之间的通信则廉价得多。基于这种架构,本文设计了两级预处理技术,旨在充分发挥当前多核架构并行机的效率。第一级预处理是基于区域分解的限制加法Schwarz技术(RAS),这种技术的优点是通信较少、收敛效果好。第二级预处理关注CPU内多核间的快速计算,通过使用线程级编程实现。文中设计了两种不同的计算方案,一种是RAS-块Jacobi预处理算法,一种是RAS-RAS预处理算法。经过数值实验表明,两种两级预处理算法的计算效率都比一级预处理有比较明显的提升,并具有比较好的可扩展性。矩阵向量运算是迭代算法中复杂度最高的过程。因此本文设计了适用于多核并行机运算的矩阵向量乘算法。基于压缩稀疏块格式(CSB:Compressed Sparse Block Format),本文给出了多CPU多核CSB存储格式及基于此格式的稀疏矩阵向量乘,并进行了相关的数值实验。结果表明,多CPU多核CSB格式及稀疏矩阵向量乘算法具有较高的并行加速比,对于带状矩阵具有良好的可扩展性。
其他文献
1.引言VoIP(Voice-over-IP)是指应用IP技术传输语音包、实现相关服务管理与控制的工具或协议的集合.由于VoIP的技术优势和成本优势,VoIP是目前增长最快的通讯技术之一.但它还
<正> 一、魏国历史简述魏国是战国七雄之一,在战国200多年中,曾独霸中原100多年。在政治经济方面,魏国首先进行改革,对当时各诸侯国及秦汉以后均有重要影响。公元前475年,中
会议
传统风扇需要人为控制风速,当人睡着后,无法及时调控风扇会导致人感冒。夏天蚊子多,传统风扇也不具备驱蚊的作用。当人想关闭或者调节风速时,无法远距离控制。针对上述缺点,
目前国内民航市场飞速发展,航空公司之间的竞争也是日益激烈。在挑战与机遇并存的环境下,航空公司为了提高自身竞争力,越来越重视员工培训。而地面服务作为航空运输的重要环
2017年底发布的《侵权责任法·医疗损害责任》司法解释规定了新的鉴定规则:确定了医疗损害专门性问题鉴定的概念及内容,取鉴定申请替代患方举证能力的不足,规定了新的鉴定人
目的:研究和证明温肾固疏方的抗氧化应激作用及抗骨质疏松作用;明确FoxO/Wnt通路在成骨细胞分化与骨形成中的作用机制;证实温肾固疏方通过抗氧化应激调控FoxO/Wnt而发挥防治
容器花卉作为一种新兴的绿化方式,已逐渐成为城市道路绿化的独特风景线。通过对南京市重要主干道和次干道的调查,对应用的花卉容器进行总结,并整理出54种应用的容器花卉,隶属
社会工作专业实践教学是社会工作专业教育中的重要环节,也是培养学生实践能力、引导学生树立正确的专业价值观和提升专业技能的重要保证。如何创新社会工作专业实践教学模式,
乌拉尔甘草(Glycyrrhiza uralensis Fisch.)为豆科(Leguminosae sp.)甘草属(Glycyrrhiza Linn.)多年生草本植物,主要分布在新疆、内蒙古和甘肃等地区。作为我国的大宗药材之一,其市
带着“贺岁档”“国产科幻片”“刘慈欣”等标签,电影《流浪地球》大年初一上映后口碑、票房双丰收——不仅获得了“中国科幻电影的里程碑作品”的赞誉和较高的评分,更在上映4
学位