多核环境下矩阵库设计与优化

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:liongliong485
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自1946年计算机问世以来,数值计算一直是计算机应用的主要领域之一,它已经广泛应用到人类生产与生活的各个方面,矩阵运算是数值计算最基本和经常使用的运算之一,它是数值计算的一个基础,提高矩阵运算的性能则显得更为重要。本文把矩阵运算与多核、并行联系起来,并分别从矩阵库的设计,矩阵库的并行化以及多核环境下矩阵库运算的优化三个方面阐述了矩阵库的实现,具体内容如下:   (1)矩阵库的设计先在完成功能、运算需求、可维护性、面向对象、并行化等方面确定了矩阵库的设计原则;然后结合矩阵的数学定义、C++的特点和以后程序扩充的需要的基础上,给出了矩阵库的组织结构,并在Microsoft VisualC++2008 Express Edition平台上完成矩阵库的设计方案,最后在文中给出矩阵行列式求值的示例。   (2)矩阵库的并行研究在分析现有的消息传递模型、数据并行模型、共享存储并行编程模型三种并行模型之后,通过比较重点介绍了一种面向共享内存的多处理器多线程并行程序语言-OpenMP,并对OpenMP指令、库函数和并行化的循环选取原则作了介绍。然后在Microsoft Visual C++2008 Express Edition平台上用OpenMP并行机制对设计好的矩阵库串行程序实施并行化。同时,给出了矩阵行列式求值的并行化处理示例。   (3)利用Intel VTune进行优化在介绍现有的一些优化工具之后,重点介绍了英特尔公司针对英特尔多核处理器开发的Intel VTune优化工具,然后在上述平台下用Intel VTune优化工具对并行处理后的矩阵库进行程序分析,采集大量分析数据,以得到各种因素对运算效率的影响,并对算法进一步分析和改进。   (4)根据本文给出的矩阵库的中的矩阵的构造、矩阵的加减乘除运算、矩阵相等、矩阵转置、判断矩阵对称、判断矩阵对称正定、一般矩阵的秩、求逆矩阵、求对称正定矩阵逆、求托伯利兹矩阵逆等运算,在现有的软硬件平台上完成了串行、并行、优化后不同方面的对比实验。   通过对矩阵各种基本操作的应用和对输出结果的分析,计算结果准确,程序基本达到矩阵基本运算的初衷;通过实例的运算比较,结果表明并行优化后的程序的性能有改善。  
其他文献
视频中的人物跟踪与行为分析技术是以人为监控目标的监控系统智能化、自动化的基础技术。目前,此类技术在军事、竞技体育等领域已有广泛应用,而在经费支出较少的普通民用领域
随着互联网的普及、软件应用技术和模式的快速发展,软件已呈网络化、平台化和服务化的发展趋势。其中,SaaS(Software as a Service)是一种新型的软件服务模式,凭借其按需租用、
现今有限元分析广泛应用于产品试验,其中网格划分即将整体结构离散化,是有限元分析前提。利用四面体进行网格划分均衡了网格划分的速度,可得到预期中的网格质量,可保证质量的
随着智能手机(Smart Phone),掌上电脑(PDA),mp4\mp5,上网本,平板电脑等小型个人终端的迅速发展,带了同一多媒体内容如何在多种终端下正确而恰当显示的问题。而数字图像和视频的获取
医学图像处理与分析是在医学、物理学与计算机科学等学科基础上发展起来的一门学科,其包括图像分割、图像配准、三维可视化、网格处理、有限元分析与虚拟仿真手术等。随着现代
关注经典的背后,关注的是中国艺术创作者的人生,关注的是中国工艺行业的未来发展。多维的层面需要多维的视角,如果你曾经热切地赞美过那些精美的作品,请再近一步。经典的背后
视频会议系统作为网络多媒体综合服务平台,可以使世界各地的合作伙伴和同事之间实现远程的交流沟通与工作协同。而仅仅拥有视频和音频功能的视频会议已经不能满足如今多媒体
随着因特网的快速发展,海量的Web数据资源已经成为人们获取知识与信息的重要来源,如何从庞杂的数据中获取有用的信息是现阶段共同面临的问题,Web信息抽取就是针对这一问题提出的
蛋白质相互作用关系(Protein-Protein Interactions,PPIs,简称蛋白质关系)对理解生物过程具有重要的意义,从生物医学文本中自动抽取出蛋白质关系可以极大地提高抽取效率。本
智能视频监控是计算机视觉的一个分支,利用计算机视觉和图像处理的方法对图像序列进行运动目标检测、运动目标分类、运动目标跟踪以及对监控场景中目标行为的描述与理解。在