综合递归分块技术及其在LAPACK中的应用

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:tzhblyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
矩阵计算在科学计算和其它很多的领域中有着广泛的应用。LAPACK是一款线性代数函数库,它实现了线性代数计算中的大部分操作,包括矩阵分解、线性方程求解、最小二乘问题和矩阵特征值求解等多类问题,它是矩阵计算中最重要的函数库之一。而随着计算机体系结构的不断发展,尤其是分层存储的出现,LAPACK中的经典矩阵计算算法和传统数据结构已经不太适应新硬件发展的需要了。为了解决这个问题,作为LAPACK性能基础的BLAS突出了对Cache和TLB等高速缓存的考虑,其中以GOTOBLAS为代表。虽然高速BLAS库的性能令人满意,但是它们通常是针对特定的平台进行优化,这种优化的手段缺乏共性,优化的程序缺乏可移植性。本文首先对GOTOBLAS库的实现机制,尤其是其中的GEMM部分的实现,进行了深入的分析,发掘出其中的规律和共性。之后,通过分析存储层次对矩阵计算的影响,结合近年来国内外的一些研究成果,提出了一种矩阵计算的理念——计算重排序理论。在此基础上,通过对比矩阵计算的各种分块算法和数据结构,提出了一种面向存储层次解决矩阵计算问题的方法——综合递归分块方法,并将这种方法应用到Cholesky分解中,对比实验表明,采用该方法既可以提高执行效率,又可以节省存储空间。最后,进一步说明了,有必要将存储层次对程序性能的影响提高到计算模型的高度。
其他文献
自动微分方法以较小的代价计算函数的导数,它在导数计算时间和计算精度等方面具有传统有限差分方法无法比拟的优越性。如今,自动微分方法在许多依赖导数的各种非线性数值算法中
学位
大数据时代的来临,用户面临严峻的信息超载问题。信息推荐技术能够帮助用户从海量网络信息中提取有用信息,因而得到研究者的广泛关注。但现有的推荐技术主要考虑从兴趣的共性
纹理合成技术能基于小纹理生成视觉上相似的大纹理,它在计算机图形学及计算机视觉中有很广泛的应用。例如,大规模场景的绘制通常需要大量的纹理来丰富其细节表达,如果直接使用大
学位
Web缓存技术是Internet环境下减轻Web服务器负载、缩短用户访问延迟、提高Web访问性能的有效方法。在移动计算环境中,由于受设备和网络的限制,缓存策略的设计必须权衡性能收益
学位
社区宽带综合业务网络系统是以交换式以太网技术为基础的用户驻地网系统,它以一个计算机网的建设成本,实现了电话网、电视网和计算机网三网业务融合。以太网交换机是该系统的核
学位
H.264是目前应用最广泛的视频编码标准,它的码率控制算法JVT-G012是一种优秀的码率控制算法,但依然存在很多缺陷。在为基本单元分配目标比特数时,仅考虑到缓冲区的状况,没有考虑
学位
XML(eXtensible Markup Language)是W3C定义的一种标记语言,目前已被广泛用于电子商务、B2B通信、企业信息集成和Web服务等应用中,成为网络环境下组织、存储和交换信息的基本方
学位
XML的广泛流行很大程度得益于可以使用模式限制XML文档的结构.静态类型化XML处理语言利用模式增加基于XML信息系统的鲁棒性和运行效率.   在编译时刻类型检查时,静态类型化
学位
软件包管理系统是操作系统中的重要组成部分,随着开源软件运动的开展,开源软件包的数量正在以指数级的速度增长,如何正确而有效地对软件包进行管理已经成为当前操作系统研究方面
学位
蛋白质相互作用(Protein-Protein Interaction,PPI)网络是生命有机体内的所有蛋白质间相互作用组成的网络,利用计算方法在PPI网络中检测功能模块是生物信息学中一项重要的研