面向超级计算机的海量近线存储系统关键技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:kongling54321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的来临,科学研究、工业应用和网络服务等领域的数据规模正爆炸式增长。当前,超级计算机在科学研究和国民经济建设中发挥着非常重要的作用,应用领域十分广泛,具体包括石油勘探数据处理、生物医药研究、航空航天装备研制、卫星遥感数据处理、金融数据分析、气象预报和气候预测、海洋环境数值模拟、土木工程设计、新材料研发、基础科学研究等。然而,随着数据规模不断扩大,超级计算机在处理大数据应用时仍暴露出一些突出的问题。超级计算机多采用集中共享式存储系统(如Lustre文件系统等),计算节点通过内部高速互连网络与存储系统相连。通常,每个Lustre系统的容量为1-4PB,实际运行情况表明:当Lustre文件系统容量使用率大于70%时,存储系统会出现不稳定现象,使得超级计算机系统的稳定性和可用性降低。现在,多个典型的大数据应用均对超级计算中心的大数据存储提出了越来越高的要求,如要求总的存储容量达到10PB甚至以上,能与超级计算机的Lustre系统有机融合,等。所以,我们需要研究一种新的存储结构,构建基于超级计算机的层次式存储系统,有效解决10PB到100PB级海量数据存储的重大技术挑战,为越来越多的大数据应用提供存储和处理服务。本文提出了一种基于双副本和RAID-Z的海量近线存储系统(TH-MSS)的技术方案,TH-MSS与超级计算机的Lustre存储系统相结合,可实现超级计算机的层次式海量存储系统,用以解决大数据应用对海量数据存储的新要求。本文的主要研究工作包括以下几个方面:(1)分析超级计算机的存储系统结构,研究利用分级存储构建超级计算机层次式存储系统的技术方法。(2)分析基于超级计算机的大数据应用对海量存储系统的需求,提出一种基于双副本和RAID-Z的海量近线存储系统的技术方案,研究数据迁移管理的相关技术方法。(3)设计实现了TH-MSS存储策略优化和资源管理优化方案,研究利用MPI实现多节点并行数据传输的技术方法,分析了相关的关键技术。(4)利用存储服务器构建实验平台,进行实验验证。
其他文献
Workflow Management Corporation (WfMC)作为”一个业务流程的自动化定义了工作流,在整体或分开,在期间文件、信息,或任务通过从一个参加者到另一个为行动,根据一套程序规则。”
软件定义网络(SDN)将数据平面与控制平面解耦,使网络变得更加灵活可控。在SDN架构中,为了支持SDN控制器获取全局网络统计信息从而高效管理整个网络,同时支持网络测量、入侵检
为满足用户对业务和应用的需求,下一代业务的开发、部署和运行必须更加便利灵活,网络和业务开发体系面临着改革,万维网服务技术使用了松耦合的集成模型,使得重用服务构建新的应用
论文结合“地税局后勤管理信息系统”项目课题,研究了基于BizFocus中间件的应用系统,概括性地阐述了中间件的概念、分类、特点与优越性,对软件开发平台-BizFocus中间件以及相关
随着网络应用的不断发展,网管系统作为与操作系统、数据库系统并列的三大基础软件平台,其重要性不言而喻。中小型企业网络规模的不断扩大,必将给网管系统带来巨大需求。通过近几
随着Internet和通信技术的发展,通信网络带宽和处理能力得以提高,使得网络能提供更多的多媒体业务,其中许多业务都要求网络具有多播能力,例如音频/视频会议、交互式仿真、多人游
学位
高性能计算机正广泛应用于国家安全与经济社会各个领域,例如核物理研究、天气预报、石油勘探,生物制药,动画制作等与社会和个人紧密相关的产业与方向,极大推动了科技水平和经
银行非现场稽核是在现代信息处理和传递方式下迅速发展起来的一种审计监督方式。银行非现场稽核系统是一个面向分析的系统,它需要实现银行海量交易数据和历史数据的存储、查询
数据仓库和OLAP是90年代初提出的概念,到90年代中期已经形成潮流。在美国,数据仓库已成为仅次于Internet之后的又一技术热点,以数据仓库和OLAP相结合建立的辅助决策支持系统是决