MPI-IO中基于模式感知的数据重组织

来源 :湖南大学 | 被引量 : 0次 | 上传用户:xuliangaihui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,高性能计算的发展使得大规模的科学计算、建模和仿真能够更快更有效地完成,为科学研究中诸多复杂问题的解决提供了巨大的契机。科学研究中常常有海量的数据需要处理,例如粒子对撞机、电子天文望远镜和核模拟等应用每秒都会产生大量的数据,需要高性能的工/0来支持。但在计算机的计算能力在以摩尔定律增长的同时,I/O的速度并没有相应地快速提高,导致其成为整个系统的瓶颈,即所谓的“I/O墙”问题。计算能力和I/O速度之间差异的日益增加成为了一个急需解决的问题。针对日益突显的I/O瓶颈问题,MPI-IO和并行文件系统被提出并得到了广泛的应用。它们以提高数据访问并行性的方式来缩小计算能力和I/O速度之间的差异。在并行文件系统中,I/O请求的数量和数据访问的连续性十分重要,但应用程序开发者一般以数据的逻辑意义来组织数据,这种方式可能带来大量的不连续的I/O请求,严重制约并行I/O系统的性能。若不考虑文件的组织方式和I/O系统的行为方式,系统的性能会极大的降低。本文通过对数据进行重组织,从而增强文件的访问模式与文件系统特性的匹配性,最终提高I/O系统的性能。本文的主要工作如下:1.本文提出了一种根据数据访问模式在I/O中件问(MPI-IO)中对文件数据进行重组织的方法,以增强数据访问的连续性并减少I/O请求的数量。在MPI-IO中对文件进行重组织的优势在于:当对文件的访问模式在这一层上被改进之后,这一层之下的所有层次都可以利用被优化了的文件访问模式,更进一步对其进行优化。本文所提出的方法通过对数据访问历史记录的分析来感知文件的访问模式,得到在此访问模式下的最优文件组织,然后对文件进行重组织。对重组织后的文件访问就会具有更优的访问模式。2.针对以上提出的优化策略,本文进行了如下设计。首先在数据访问记录中分析文件的访问模式,然后根据此模式重组织文件并建立重映射表。当再次运行此程序时,重映射表会被加载到内存中。当新的I/O请求到达时,MPI-IO首先检查此请求是否在已经建立的模式之中。如果其在已建立的模式中,那么MPI-IO中的重映射层会把这个请求中的偏移量等信息转换成在新的文件组织下的偏移量。最后,新的请求会被发往下层文件系统,实现数据的访问。3.本文在MPI-IO和PVFS2(Parallel Virtual File System2)上实现并测试了模式感知数据重组织系统。本文首先对比了模式感知系统中所提出的基于I/O签名的重映射表与其他映射表的性能。实验结果表明基于I/O签名的映射表具有更快的查询速度,并且占用更少的空间。其次,本文测试并证明了模式感知文件重组织系统对应用程序访问模式的变化有良好的容错性。再次,本文利用业界常用的IOR和MPI-TILE-IO对本系统的性能进行了测试和分析。本文所提出的数据组织方式可在原系统基础上将机械硬盘或固态硬盘读数据的性能最高提升一个数量级,对写数据的性能最高提升两个数量级。
其他文献
随着传感器技术、微电子系统、现代网络和无线通信技术的飞速发展和日益成熟,传感网(Wireless Sensor Network,WSN)逐渐被应用于国防军事、智能建筑、国家安全、环境监测等多个
近年来,随着多媒体技术以及网络技术的快速发展,多媒体数据急剧增加。由于视频的低层特征与人类思维中的语义概念之间存在语义鸿沟,基于语义概念的视频检索已经成为视频内容检索
随着互联网时代的高速发展,对海量数据的存储和分析变得越来越重要,也涌现了很多的技术对海量数据进行存储和分析的计算。另一方面,我们同时也可以通过数据降维算法来有效的
随着计算机网络的普及,网络安全受到更多的关注,入侵检测系统是一种主动防御系统,它为网络安全提供了一道有力的防线。随着攻击方式的日趋多样,越来越多的智能技术被引入入侵检测
图像融合技术是图像理解和计算机视觉领域中一项重要的课题,广泛应用于军事、计算机视觉、遥感应用等领域。本文对遥感图像的融合及配准等相关技术进行较为深入的研究,主要研究内容如下:1.在分析比较基于互相关、基于互信息和基于小波变换的图像配准方法的基础上,提出了基于非采样Contourlet变换(Nonsubsampled Contourlet Transform, NSCT)和互信息准则的图像配准方法,
能量高效的数据管理方法已经受到学术界和商业界的广泛关注,能耗已经成为制约IT技术进一步发展的重要因素。从数据中心的生命周期来看,能耗已经超过硬件成本成为数据中心运行仅次于人力资源成本的主要代价。大规模海量数据的爆发的推动了云计算技术的发展,云可以看作是一个集中式管理的具有海量数据存储和计算能力的超大规模分布式计算系统。随着云计算技术的发展计算集群的规模不断扩大,也带来了能量的巨大消耗问题和热量快速
2011年3月国际互联网名称和编号分配公司(ICANN)官方宣布最后一批IPv4地址被分配完毕,表明IPv6取代IPv4迫在眉睫。由于目前大多数Intranet网络基础设施都是基于IPv4协议的,所
视频监控系统的发展已有20余年,从最早的模拟监控到数字监控,再到现在方兴未艾的网络监控,发生了巨大的变化。同时,视频监控也覆盖到了各行各业,各个行业的监控需求虽有其共
随着嵌入式产业迅速发展,实时操作系统(RTOS)作为核心基础软件被广泛应用,对确保RTOS系统的可靠性、稳定性、鲁棒性等提出了很高的要求。RTOS的可靠性与其自身的复杂性紧密相关
本文通过对现有的DPI深度报文扫描技术和DFI深度流量扫描技术进行较为细致的对比分析,提出了将DPI与DFI相结合,通过使用可自定义的协同策略,DPI与DFI互补运行,共同对P2P数据