多核集群上的高性能MapReduce平台的研究与实现

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:dickui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能计算已经在国家的科学研究和科技服务行业中占有举足轻重的地位,高性能计算的发展水平已经成为体现一个国家综合科技实力的重要标志。 高性能计算需要硬件支持和软件支持。硬件支持就是高性能计算机(超级计算机)。近几年,多核技术蓬勃发展,为高性能计算注入强大动力。以多核集群为主流架构的高性能计算机正在成为高性能计算任务的最主要的硬件支撑平台。不同并行计算机体系结构模型的编程风范不同。不同的并行编程风范,是建立在不同的并行编程模型上的。共享变量和消息传递是最常用的两类并行编程模型。虽然其模型本身不难理解,但对并行的描述与表达层次较低,缺少对传递各种复杂的用户自定义数据类型的支持。开发者在使用它们时,必须花费许多时间和精力来熟悉并显式地使用它们所提供的各种同步、通信原语,借此来组织并行任务之间的协作关系。程序的复杂性常常会掩盖并行算法和并行程序本身的结构,导致对并行程序阅读、维护和扩展的巨大障碍。 因此,有必要研发新的并行编程模型及其开发环境工具,使它们能在较高的抽象层次上以一种更易理解和更易使用的方式来表述并行计算问题,尽可能对开发者隐藏或屏蔽并行任务间的交互细节,降低编程难度,同时又使程序保持很高的执行效率。本文针对上述问题开展了以下研究工作: (1)分析传统并行编程模型及其程序开发环境,总结它们的特点,寻找需要改进之处,为研发新的并行编程模型做准备。 (2)研究MapReduce并行编程模型,分析其适合并行计算的优点:高度抽象、编程简单、适用范围广、可扩展性和可移植性好。 (3)改进Google的MapReduce模型,使其适合高性能计算需求。 (4)研究现有MapReduce平台的设计思想和实现方法,设计和实现一套专门针对高性能计算的全新的MapReduce平台--HPMR(High-Performance MapReduce),作为新的并行编程环境工具。 (5)通过实验分析HPMR系统的性能,展示它具有简单、高效和实用的特点,说明其可以作为新一代并行编程平台应用到实际并行应用软件开发中。 本文研究工作的目标:设计并实现HPMR系统,它是一个建立在多核集群上的高性能计算软件支撑平台,它继承并改进了Google的MapReduce并行编程模型,使其适合高性能计算需求,它让并行程序的编辑、编译和运行变得非常简单,同时又保持很高的执行效率。
其他文献
虚拟外科手术仿真系统主要应用于医学教育、外科手术计划、手术培训、术中辅助支持等,而人体软组织及器官的切割变形仿真是虚拟手术仿真的重要组成部分,需要满足实时性、稳定
在现代社会,互联网急剧地改变着我们的生活,面对互联网上巨量的信息,如何得到我们真正想要的信息变成了一个非常重要的问题,网页分类便成为了一个热点研究领域。网页分类就是
云计算是近年来新兴的一种基于网络的共享基础架构的方法,通过互联网、虚拟化等技术将大量的系统池等资源连接在一起为用户提供一系列更为便捷的服务。云存储系统是一个主要
随着网络音乐服务产业的发展,音乐数据的采集、存储、处理和传播的数量也与日俱增,实现音乐数据的共享,可以提高已有音乐数据的使用效率,减少数据收集等重复劳动和相关费用。然而
胶囊内镜作为一种新兴的、实现全消化道检查的内窥镜技术,随着技术愈发成熟、功能逐渐完善和检查成本不断降低,得到进一步普及和应用。与此同时,胶囊内镜使用所产生的图像数
随着Ajax的出现和Internet的发展,WebGIS已经有了长足的进步,传统WebGIS已在慢慢地被基于Ajax的WebGIS所取代。Ajax引擎所采取的异步方式可以很好的解决传统GIS所存在的响应缓
学位
Android系统由于其秉承开放特性,导致其比iOS等封闭系统更容易受到攻击,同时巨大的市场份额也让攻击者觉得有利可图,因此恶意软件已在Android系统上泛滥成灾。对Android系统
随着数据库技术的成熟,数据库管理系统己经成为人们管理数据的重要的手段。如今,相当多的企事业单位和政府机构内部的数据库管理系统都存储着一些独立的、分散的数据。由于在
随着信息化建设的飞速发展,企业各应用系统之间的协作和信息共享日益重要。企业在开发各个应用系统时,往往只考虑各自的特定要求,导致了这些应用系统的环境不一致、数据格式
目标跟踪是在给定视频的连续帧中找出目标并进行持续跟踪。本文针对目标跟踪中最有现实研究意义及应用价值的行人跟踪展开研究。通常,目标跟踪算法大致可以分为基于检测的跟