基于GPU平台的KLU并行算法的研究与实现:预处理及回代求解

被引量 : 0次 | 上传用户:nilaomei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大型电路模拟中,Ax=b形式的线性方程组的求解是影响电路模拟效率的关键问题。为了解决这一问题,目前已经存在许多针对大型电路模拟矩阵的求解器,例如sparce 1.3、superLU、KLU等。实验表明,与其他算法相比,KLU算法效率更高、更适合于处理大型电路模拟矩阵。KLU(Clark Kent LU),是由Clark Kent专门针对大型电路模拟矩阵设计的一种新型的稀疏矩阵求解算法。KLU算法共分为四个阶段:预处理阶段、分解阶段、再分解阶段、求解阶段。本文重点在GPU平台上,对KLU算法中的预处理阶段(btf_strongcomp算法、)和求解阶段(klu_solve算法)进行并行性研究与实现。在预处理阶段,利用btf算法将矩阵转化为上三角块的形式。btf算法包括两个部分:btf_maxtrans算法和btf_strongcomp算法。对btf_strongcomp算法在GPU平台上的可并行性作了详细的研究与探讨,提出了几种可并行的方案:深度优先搜索算法、可达矩阵算法、zdec算法的并行,并对DCSC算法在GPU平台上的可并行性作了研究。研究结果表明,在GPU平台上实现btf_strongcomp算法的并行,会导致算法性能下降,进而降低KLU算法的整体效率。但是对于某些矩阵而言,在使用zdec算法将矩阵转化为上三角块的形式后,可以提高KLU算法的整体效率。求解阶段可分为两部分:顺序消元和回代求解。由于在顺序消元的过程中存在很强的依赖性,本文只对klu_solve算法的回代求解部分在GPU平台上实现了并行。对于大部分矩阵而言,并行实现的klu_solve算法在Nvidia GeforceGTX275平台上的运行时间,是串行klu_solve算法在Intel Pentium D 2.80GHzCPU平台上运行时间的10倍以上。本文通过分析电路模拟矩阵和GPU平台的特点,并将KLU算法中的btf_strongcomp算法和klu_solve算法在GPU平台上实现了并行。实验结果表明,KLU算法中的预处理阶段和求解阶段不适合在GPU平台上实现并行。
其他文献
本文基于资本的视角,探讨不同类别资本在提升我国专业学位研究生创业意愿中的作用及交互作用。通过231个研究生样本的问卷调查,结果表明专业学位研究生的社会资本显著地正向
科技的进步带动了不同行业当中技术的发展,也给行业当中的生产工作方式带来了变革,同样是随着科技发展带来的技术变革GPS技术在测绘当中的应用,已经能够在不同方面和工程中的
上市公司的并购重组,通常都是高溢价收购,有的甚至还是高溢价收购"壳公司"或亏损公司。虽然在这些收购中,不乏有收购标的作出业绩承诺,但在业绩不能达标的情况下,这些收购标的
自古以来,广西交通以水运为主,直到近代亦是如此。水运业在近代广西社会经济发展过程中扮演着重要角色。然纵观整个近代,广西民族航运业始终未见有蓬勃发展的态势,究其原因,
热应激是机体长期暴露在热环境中无法充分将体内的热散出而导致机体温度失衡的一种状态。随着miRNA检测技术的进步,许多学者发现,热应激会导致miRNA的表达量发生变化。miRNA
政党是当代最重要、最活跃、最有力量的政治实体,它对一个国家政治过程起着决定作用。政党政治指政党影响国家政权并在国家和社会生活中处于中心和枢纽地位的政治类型。中国
采用石墨炉原子吸收光谱仪,实现了铁镍基高温合金中痕量银、砷、铋、铅、硒、碲元素的直接测定,分析过程简便快捷,测定结果准确可靠。为了有效消除基体干扰,基于仪器纵向交流
目的探讨护理干预对再植(造)术后患者便秘的影响。方法选择2007年再植(造)术后卧床患者100例为对照组,2008年再植(造)术后卧床患者100例为观察组,设计再植(造)术后患者健康需求调查表
目的:神经源性肺水肿(Neurogenic Pulmonary Edema, NPE)是指无原发性心、肺、肾等疾病的情况下,由颅脑损伤或中枢神经系统其他疾病引起的急性肺水肿。神经源性肺水肿的发病机
目的:了解重庆市城乡中学生的营养状况及膳食行为特征,查明中学生营养方面存在的主要问题,并分析影响其营养状况的相关因素,为制定相应的政策与措施提供科学依据。方法:采用