【摘 要】
:
稀疏矩阵向量乘法(SpMV)是求解稀疏线性方程组的计算核心,被广泛应用到经济学模型、信号处理等科学计算和实际应用中。在工程应用中,重复调用稀疏矩阵向量乘内核的次数常常会达到成千上万次。但是SpMV的浮点计算操作和存储访问操作比率却非常低,且存储访问复杂。因此,提升SpMV的计算性能成为提高工程效率的关键。目前对于提高SpMV计算性能方法的研究有稀疏矩阵数据压缩算法、稀疏矩阵数据存储格式预测算法、异
论文部分内容阅读
稀疏矩阵向量乘法(SpMV)是求解稀疏线性方程组的计算核心,被广泛应用到经济学模型、信号处理等科学计算和实际应用中。在工程应用中,重复调用稀疏矩阵向量乘内核的次数常常会达到成千上万次。但是SpMV的浮点计算操作和存储访问操作比率却非常低,且存储访问复杂。因此,提升SpMV的计算性能成为提高工程效率的关键。目前对于提高SpMV计算性能方法的研究有稀疏矩阵数据压缩算法、稀疏矩阵数据存储格式预测算法、异构高性能硬件计算结构、Cache结构优化等,旨在提高数据运算速度和减少对内存的访问次数。然而,在SpMV的计算过程中存在Cache数据不命中和Cache容量的限制等问题,使得Cache数据不命中情况大量存在,由此产生的存储访问延迟降低了SpMV的计算性能。M处理器是国防科技大学课题组自主研发的高性能多核处理器,拥有多个DSP内核。每个内核计算资源丰富,支持单周期最多达50次并行乘加计算,拥有双向量Load/Store控制单元提供向量计算所需数据。其DMA部件有三条主机物理通道,可实现数据在核内与核外各存储部件之间的高速传输。本文根据项目对高性能共轭梯度算法(High Performace Conjugate Gradient)的计算性能的需求,结合处理器单元结构,提出了一种数据传输方式—SGDTM(Super Gather Data Transfer Mode),增强离散间接访存效率,从而提高存在访存瓶颈类算法的计算性能。在DMA部件中,参考通用主机物理通道的设计思想,设计了一条专用数据通道APip(Application Pipe)来实现SGDTM数据传输方式。本文的主要工作内容体现在以下几个方面:1、结合本课题中处理器结构和资源,提出了一种增强离散间接访存效率的传输方式——SGDTM。详细的介绍了此种传输方式的访存原理。2、为了在M处理器实现SGDTM传输方式,在原DMA部件中设计添加了一条面向SpMV计算的专用主机物理通道APip。详细介绍了该通道的主要结构的实现过程,主要包含状态机部分、读索引部分、读数据部分、异常检测部分以及传输结束部分。3、对增添了APip通道的DMA进行了模块级的验证。根据设计规范,确定了详细的验证计划,采用Verilog硬件描述语言搭建验证平台,详细的介绍了各组件的设计方案。分析覆盖率文件,增加测试激励,对DMA进行全面的验证。除去部分可以解释未覆盖原因的代码,覆盖率达到100%。4、在某厂家40nm工艺条件下,使用DC综合工具对DMA模块进行了逻辑综合。综合结果满足项目对DMA的时序、面积、功耗等的需求。5、对SpMV计算性能进行了系统级评估。介绍了SpMV算法结构和应用程序的设计实现,以及性能测试原理。分析处理器中可能影响该算法性能的瓶颈,分别从软件程序层面和硬件结构层面进行优化。优化后,SpMV性能有比较明显的提升,其双精度浮点操作达14.62 GFLOPS,带宽利用率为12.31%。
其他文献
目的:通过对中国汉族人群隐睾患者和健康个体的白细胞介素-31(IL-31)基因rs4758680和rs7977932位点单核苷酸多态性的分析,了解IL-31基因rs4758680和rs7977932位点等位基因及基因型分布情况,并进一步探讨IL-31基因rs4758680和rs7977932位点单核苷酸多态性与隐睾遗传易感性的关系。材料和方法:选取2010年1月至2015年12月在川北医学院附属医
中小基学础教,沈育阳是市国把民加教强育中体小系学的党建工作作为办好人民满意教育的根本保证。近年来,沈阳市中小学校党建工作扎实推进,"红色堡垒工程""红色传人教育""红色
随着铁路桥梁建设增多,大跨度铁路桥梁抗震设计变得尤为重要,然而现有规范只针对中小跨径桥梁,对大跨度桥梁抗震性能了解不够深入。钢桁架拱桥作为大跨度桥梁中一种常见桥型,具有良好的稳定性和优美的造型等特点并且广泛地应用于铁路桥梁建设中。因此本文针对一座大跨度上承式钢桁架拱桥进行地震损伤演化与易损性分析,主要内容如下:(1)针对方钢管、方钢管混凝土、钢筋混凝土构件选择适用的损伤评价指标,确定了基于增量动力
海上气候多变,舰船航行时需要得到第一手天气信息,根据实时天气状况做出相应的航路规划和应急预案。气象传真图是通过远端气象台站进行传播的实时气象信息载体,在航行中舰载人员可以通过解析气象传真图像来得到实时天气情况,对航行决断起到至关重要的指引作用。通过现代数字图像处理技术和深度学习技术完成气象传真图的解析工作,可以提升海上舰载人员的识图效率和准确性。本课题以气象传真图像为研究对象,分析图像的特征和实际
实现棉花产业现代化必须着眼于以家庭农场生产经营为基础的新型农业社会化服务体系建设。但是新疆的棉花生产也存在着大量的不容忽视的农业技术服务问题,同时新疆棉区农业技
武汉市积淀了厚重的网球文化,曾培养出了包括李娜在内的许多网球人才,李娜是一位地道的武汉人,也是亚洲第一位大满贯女子单打冠军。因为李娜,网球运动在我国得到了前所未有的
藏医针刺疗法是藏医六大外治法之一,其内容以针刺适应、禁忌症、器械形状、穴位、分类、姿势、进针法、手法限度、死亡征兆、针刺反应、功效等构成。在一千多年的临床治疗中发挥着重要的作用,然而藏医针刺法在漫长的历史长河中逐渐消失或失传。时至今日,除了一些零碎的眼疾拨障术之外,藏区几乎没有针法的传承足迹,本文通过总结和对比藏医与中医针刺背俞穴的数量、定位及刺法之间的异同,从文献查阅中分析藏医针刺学的起源与发展
家庭小说主要指以家庭生活为中心,描写爱情婚姻、家庭琐事、人际关系,以至拓展到社会世态及各阶层众生相为题材来反映现实生活的小说作品。小说的主题则一般被理解为小说的题材或中心思想,在小说的创作过程中,如审美意象的选择、叙事过程的设计或者叙述话语的风格都是围绕着作品主题确定的。本文以家庭小说叙事主题为中心,以同处于东亚儒家文化圈的明清时期的中国、朝鲜朝的作品为例,通过主题学、社会历史批评、文化学批评、女
坚硬石英砂岩顶板与瓦斯在我国煤矿中普遍存在,对于坚硬石英砂岩失稳垮冒摩擦效应及其引发采空区瓦斯爆炸燃烧的机理尚未完全明确,往往在发生相关事故后才意识到此类事故隐患的存在,因而易成为瓦斯防治工作的死角。因此研究坚硬石英砂岩失稳摩擦效应及其引发瓦斯爆燃的影响因素,明确事故发生机理,对于煤矿的安全生产,保证人身财产安全具有重要意义。本文对上覆岩层稳定性进行了力学分析,考虑到断裂角的影响,推导出包含断裂角
断层是矿井中常见的地质构造,断层的存在破坏了上覆岩层的整体性,打乱了岩层连续整体赋存的格局,影响原岩应力的分布状态。回采过程中断层稳定状态被打破,极易发生活化,进而诱发不同程度的煤岩动力灾害。本文通过理论分析、相似材料模拟试验等方法研究了断层影响下覆岩破断特征及位移规律,研究了断层影响下横向离层裂隙、纵向破断裂隙及覆岩运移形态的演化规律,基于砌体梁理论,结合断层活化宏观力学分析,对断层活化顺序、断