基于多核处理器的数值算法并行优化究

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:laiwuywg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多核计算机的日益普及,大规模科学与工程计算、事务处理与商业计算的需求,以及数据挖掘应用领域的不断扩大,基于多核平台的线性方程组数值求解算法和大数据量数值关联规则算法的研究显得非常重要。由于多核技术会增加多线程的创建、通信和销毁等开销,如何有效发现程序中的可并行性能、优化多核并行程序及发挥多核的最佳性能,成为高性能计算领域研究的重要课题。本文给出了Cholesky分解算法的详细推导过程,分析了Cholesky分解并行按照块分配的任务分配策略存在负载不均衡,提出了块交叉分配方案,并与卷帘分配方案对比。对这三种算法均采用了提前发送策略,并在MPI集群系统上进行了实验和分析。针对Cholesky分解基于MPI的并行算法设计复杂、进程负载均衡困难、消息传递和数据移动开销大问题,以及基于多核采用OpenMP并行化的并行性开销增大和线程负载不平衡的问题,着重考虑多核计算机的优势,提出了一种基于任务划分的Cholesky分解多核并行优化算法。该算法将大循环问题划分成各个相互独立的小任务,并运用递归技术﹑任务窃取技术和动态负载均衡算法使这些任务能够并行完成。在分析了关联规则挖掘Apriori算法及其并行算法存在的不足的基础上,提出了一种改进的关联规则挖掘的多核并行优化算法。该算法对Apriori算法的压缩矩阵进行了改造,并在多核平台下利用OpenMP技术和TBB技术,对串行程序进行循环并行化和任务分配的并行化设计,最大限度地实现并行关联规则挖掘,提高关联规则挖掘效率和多核CPU的利用率。算法程序设计过程引入了Intel Parallel Studio并行套件,对基于多核的并行算法进行内存﹑线程检查和性能优化,消除采用多核平台并行化所造成的数据泄漏﹑数据竞争﹑死锁和效率低等问题。实验结果证明基于多核所提出的算法具有较高的并行效率和较好的加速比。
其他文献
P2P视频点播是目前网络应用研究的热点,而数据请求任务调度是P2P视频点播系统设计时需要考虑的关键问题。绝大多数现有的数据调度策略都是从请求节点端出发来进行设计。在这
在我国信息社会高速发展的今天,传统的选举计票方式已经远远不能够满足社会的需求。以往的计票方式,如基于人工唱票的方式、基于电子选举方式和基于机器识别和智能票箱的方式
随着经济的发展,智能交通系统(Intelligent Transportation System,ITS)已成为解决现代道路交通问题的一个重要手段。车载导航系统是ITS的重要组成部分。车载导航系统是由计
随着网络和多媒体技术的不断发展,网络可视电话(VoIP)技术已经在Internet中得到广泛的应用。如何设计一款软硬件简单、稳定性好、音画质高以及价格适中的VoIP终端将具有很好
WSN中传感器节点能量、存储处理和传输能力的限制使得传统的路由协议不适合无线传感器网络,同时与平面路由协议相比,分簇路由协议具有更好的健壮性和可扩展性,适用于大规模WS
工作流模型可以清晰的描述业务流程,而且随着信息技术的进步,其应用范围也越来越广,对工作流模型的科学评价也越来越成为必要。然而,传统工作流管理系统通常只是严格按照工作
时间序列是指将某种现象某一个统计指标在不同时间上的数值按时间先后顺序形成的序列。由于真实系统或现象的内部通常会受到多种因素的影响,从而导致输出的时间序列具有许多
随着互联网的盛行,主流的在线社交媒体取得了突飞猛进的发展,而微博在这些在线社交媒体中表现出了更加突出的发展态势。微博已经吸引了海量的用户,人们在微博上分享自己的观
近些年来,随着计算机技术、网络技术、信息技术的高速发展以及电子产品成本的急速下降,企业的信息化得以空前的施展,信息化使得企业在发展过程中积累了不少数据。市场环境变
随着互联网技术的广泛发展,互联网已经成为目前世界上最大的信息资源库。在互联网信息空间中如何快速、准确、全面的找到自己想要的信息已经成为21世纪互联网技术的一大难题