GPU上稀疏矩阵向量乘积优化及最优存储格式预测方法

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:zyj3221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
求解大型(稀疏)线性代数方程组(Ax=b)是科学计算的基础共性问题,其主要计算量是(稀疏)矩阵向量乘积(SpMV),因此,高效计算矩阵向量乘积是提升科学计算的核心重要环节。近年来随着图形处理器(GPU)的快速发展,其多处理器和独特的物理架构适合计算密集型和高度并行的计算。GPU上SpMV的性能主要受稀疏矩阵存储格式的影响。本文利用GPU对稀疏矩阵向量乘积进行加速,并研究最优存储格式的预测。首先,基于JAD格式的排序思想,我们对ELLR格式进行了优化和改进,提出了PELLR格式。通过排序减少了SpMV的迭代次数和冗余计算,且与ELLR格式相比,PELLR格式的性能提升了 1.5倍。与其它格式对比,如CSR、BiELL等,70%测试矩阵中PELLR格式是性能占优的。此外,我们推导了公式用于计算迭代次数和矩阵行非零元素个数的扰乱程度。其次,我们提出了一种方法来预估GPU上SpMV的计算时间,通过预测的时间来判断哪种存储格式对SpMV在计算上是最优的。该方法采取了分而治之的思想,把总时间分为三部分:数据传输Tc、SpMV计算Ts和结果重排Tp,每个部分的估计分别使用了GPU的构架参数和稀疏矩阵的结构特征,其中Ts的估计在矩阵行数进行了区间段的划分,在每个区间段上利用机器学习的方法来建模迭代次数和时间的关系。我们还探讨了SpMV的计算次数对三部分时间占比的影响。对ELL格式的验证表明,在相对误差≤0.05和绝对误差≤1.5下,预测都有85%的准确率。
其他文献
提到陶瓷,人们会想到碗,盘,花瓶等这些人类日常生活中使用的器物,同时也会惊叹那些陈列在博物馆的精美陶瓷艺术品。一直以来,陶瓷不仅仅作为具有实用价值的日用品,还作为人类
在二语习得领域,如何有效地促进语法习得一直是研究者们主要关注的问题。近年来,研究关注于输入加工教学法(Processing Instruction,PI)和意义型输出教学法(Meaning-based Ou
随着中国综合实力的增强,汉语在全球的影响力越来越大,学习汉语的外国人越来越多,他们报考汉语水平考试的积极性也越来越高。伴随着海外考生的增多,汉语水平考试也得到了迅速
胶囊作为日常的保健品和药用品随处可见,而缺陷胶囊流入市场可能会对消费者的生命健康造成威胁。国家对胶囊的检测标准也越来越高,但是大部分制药企业仍然在采用人工灯检的方
公信力是指一定的组织机构、社会团体和重要人物所具有服务能力能赢得民众信任的力量,表达的是特有主体所具有的权威性和社会信誉度在民众心中的影响力。乡(镇)政府公信力是
对外汉语教材研究一直是学术界极其关注和重视的方面,近年来许多学者开始把目光转向了对外汉语对教材中的人物设计。对外汉语教材尤其是初中级汉语教材多以人物对话的方式展
目的:研究估算肾小球滤过率对急性冠脉综合征患者冠状动脉病变为重度的预测价值。方法:选取中国医科大学附属盛京医院2017.9.1-2018.8.1因ACS住院完善冠状动脉造影(coronary a
中国山水画和瓷器都是中国传统艺术史上璀璨的明珠,山水画在瓷画中也占据很大内容。山水画入画瓷器,形成瓷画山水画,瓷器山水画因瓷器载体的缘故,而产生出独特的魅力,瓷画山
隶书在中国书法史上具有重要的地位和价值,是中国古今文字发展的分水岭,它是对古文字的告别,今文字的开篇,也是书法五体中的一种重要的书体,可以说隶书为行书、楷书、草书书体的出现和发展奠定了基础,开创了中国书法艺术的新境界。简略看隶书发展的脉络,它萌芽于战国时期,在秦代有所发展,兴盛于两汉时期,汉以后,隶书的发展进入衰微期,虽在唐代有所发展,但在其他时代几乎成为绝学,直到清代才得到复兴。当代书法是一个以
2017年刘广明案司法裁判中首次援引保护规范理论用以认定行政诉讼原告资格,提供了全新的“利害关系”判定标准。后保护规范理论多被援引认定行政第三人原告资格,其适用的重要场域之一便是相邻人案件。为进一步探讨保护规范理论在我国的司法引入以及如何具体适用等问题,本文以相邻人案件为切入点展开具体论述,也旨在为其他行政第三人原告资格认定提供借鉴。在相邻人案件中,相较于“不利影响”、“实际影响”等已有利害关系标