求矩阵特征值的GPU并行算法的研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:waich19870625
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
求解矩阵特征值是科学计算中经常涉及到的问题。随着矩阵规模不断增大,串行算法在计算时间上无法满足人们的需要。采用并行机或者集群系统可以缩短求解大规模矩阵特征值的时间,但是因此会带来设备成本及耗电量的增加。为了解决上述存在的问题,本文提出了基于CUDA (Computer Unified Device Architecture)的雅可比迭代法求解对称矩阵特征值的GPU (Graphic Process Unit)并行算法Hybrid Algorithm(简称HA),从而克服了传统串行算法计算时间较长的问题。HA算法是结合本文提出的两个并行雅可比迭代法PA-1和PA-2这两个算法而提出的。PA-1和PA-2的主要思想都是把串行雅可比算法的求对称矩阵非对角线元素中绝对值最大者和矩阵更新这两步利用CUDA并行实现。PA-1与PA-2算法的唯一不同之处在于求对称矩阵非对角线元素中绝对值最大者时采用的算法。HA算法则是结合了PA-1和PA-2这两个算法的优点产生的。实验结果表明,HA算法比传统的串行算法运行时间要短,加速比为9.85~13.71。通过实验结果可以看到:随着矩阵规模的增加,加速比的总体趋势呈上升状态;随着迭代次数的增加,加速比非常稳定。因此,传统的串行算法的运行时间被显著减少了。本文同时也提出了基于CUDA的求解一般矩阵特征值的QR并行算法PA-QR。但是利用QR算法求解矩阵特征值要先把一般矩阵转化成上H矩阵,因此本文先提出了把一般矩阵转化成上H矩阵的并行算法PA-H。PA-H算法的主要思想是利用CUDA并行实现一般矩阵转化为上H矩阵的串行算法中的求出第k-1列的第k-1个以下的元素中绝对值最大的元素和行交换、列交换以及进行变换时对行和列进行消元变换。PA-QR算法的主要思想就是利用CUDA并行实现串行QR算法中的4个一重循环。实验结果表明,PA-H算法的加速比为1.79~7.81,而PA-QR的加速比可以达到3.24~118.9。并且随着矩阵规模的增加,加速比在不断增加。随着迭代次数的增加,加速比非常稳定。
其他文献
试验从宁夏中宁某猪场疑似为猪丹毒病例的关节液中,采用常规分离培养法进行分离培养,对分离菌株进行生化鉴定试验和药敏试验。初步判定为猪丹毒杆菌致死。药敏试验分析结果表
在初中英语教学中,培养学生英语学习兴趣,是帮助学生加快知识的理解和掌握,提高英语语言运用能力,让学生通过英语学习,获得知识能力双提高的前提和基础。应如何激发的培养初
为了更好地借鉴国外社区银行发展经验,提高新常态下我国金融行业对社区和中小企业的服务能力和效率,探索我国社区银行这一新兴业态发展的可行性。在简要回顾国外社区银行发展
<正>随着畜牧养殖业的快速发展,人畜共粮的矛盾日趋突出,为了解决这一问题,世界各国科技界和工业界都在寻找和研究新的饲料资源,其中蛋白质饲料尤其受重视。蛋白质是畜牧养殖
<正>甘草在临床上分生品和炮制品入药,甘草有多种炙法,但2010年版《中华人民共和国药典》和《中华人民共和国兽药典》中只介绍了生甘草、蜜炙甘草两种炮制方法[1-2]。考证结
<正>北方冬季的恶劣环境对于各阶段生猪的健康生长发育都有着严重影响,轻者影响猪只的生长速度或饲料报酬,重者导致疫病的暴发和流行,如冬季猪场发病率比较高的猪呼吸道疾病
<正>福泽谕吉(1834—1901)是近代日本的著名人物,被誉为日本的"启蒙教育家""启蒙思想家"。他游历欧美,主张向西方学习,开启了日本的民智,但同时他又鼓吹"脱亚入欧",污蔑邻国,
家庭农场作为一种新型的农村经营主体在促进农村经济发展和推动新型农村改革等方面发挥着积极作用。目前,我国家庭农场的发展正处于起步阶段,急需金融资金支持。农村金融体系
一马克思主义实践观马克思主义哲学最显著的特点就是它的实践性,实践的观点是马克思主义哲学首要的、基本的观点。"实践是人们为了满足一定的需要而进行的能动地改造和探索物
电气工程施工图是设计阶段对电气工程总造价控制的重要环节,那么首先要解决的是电气工程耗量及其预算问题,电气工程施工图预算是保证工程顺利进行的重要前提。本文对如何编制