面向托管式语言的异质内存管理和优化

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:dian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据中心、大数据应用的发展,DRAM(Dynamic Random-Access Memory)技术由于工艺限制,其存储密度增速难以满足计算规模的快速增长。将存储密度大、价格低廉,但性能弱于DRAM的非易失性内存(Non-Volatile Memory,NVM)和DRAM构成异质内存是解决该问题的一个主流研究方向。此时,需将应用中的数据进行冷、热划分,并布局到异质内存中的DRAM和NVM部分。托管式语言,如Java,Scala等,被广泛应用于分布式系统、嵌入式系统等框架的开发。由于托管式运行时自身具有内存管理模块,其往往和操作系统、硬件的的异质内存管理机制策略产生冲突。  本文围绕“利用托管式运行时系统管理异质内存”的思想,来解决多系统层次同时移动数据造成的冲突问题。针对数据使用行为复杂的单机应用和计算行为规则的大数据应用,本文分别提供了基于程序分析的数据划分策略和数据布局编程接口。最终,该研究基于内存计算框架Spark和Java运行时OpenJDK实现了贯穿大数据应用、大数据框架、运行时系统、异质内存的一体化管理框架。  本文的创新点主要有:  ·基于运行时系统,针对单机应用提出了一种粗、细两级粒度的冷、热数据划分,并利用GC进行数据布局的方法。本文直接利用运行时堆现有的数据生命周期、数据类型等数据分类,进行粗粒度的冷、热数据划分;本文发现了程序中的物理访存主要由极少量函数造成的现象,并提出了基于函数访存密度(Memory Access Density)的细粒度冷、热数据划分方法。最终,针对Dacapo等程序,在异质内存中的DRAM比例为15%-25%时,和使用与异质内存等量的DRAM相比,仅有5%-25%的性能差。  ·本文对典型内存计算框架(Spark)的迭代计算应用的磁盘开销、GC、计算特征等进行了系统分析,发现其基本单元(RDD)之间具有显著的访存差异和生命周期差异,而单一基本单元内部的众多数据则具有类似的访存行为。基于此,本文提出了一套以自定义数据结构(RDD)为布局粒度的异质内存编程接口。  ·提出了一种跨层的“大数据框架-运行时系统协同”的数据布局策略。通过本文开发的数据信息传递通道,应用开发者对单一自定义数据结构(RDD)进行位置(DRAM、NVM)标注后,标注信息首先在Spark层次中相互依赖的RDD之间进行传播,然后运行时层根据标注信息划分众多孤立的数据对象,并基于该数据划分进行异质内存布局和定向优化。使用本文提出的编程接口对现有Spark应用进行轻微修改,便可以RDD粒度在异质内存上进行数据布局。在使用DRAM比例在25%-35%的异质内存时,可以达到全部使用DRAM时80%-97%的性能。
其他文献
随着软件产业的迅速发展,软件系统的功能和结构日益复杂,人们对于软件产品的质量要求也越来越高。最常用的程序质量问题检测的技术包括软件测试和形式化验证。两种方法各有优缺
地形渲染是虚拟现实技术中非常重要的一部分,也是计算机图形学一个热门的研究课题。它广泛应用于地理信息系统、战场仿真、飞行模拟、电子地图、地形漫游和游戏娱乐等方面。随
移动学习系统是一个新型的E-learning学习环境,利用移动技术随时随地的特性,为学习者提供更加便利的学习支持服务。在面向职业培训和在岗学习的移动学习系统中,学习资源是一种特
在计算机科学领域中,程序分析足一种自动化地分析计算机程序的行为的重要技术。程序分析技术主要应用于程序的优化和程序正确性验证两个方面。现代编译器常常会利用程序分析技
BPEL(业务流程执行语言)作为一种Web服务组装协议,是使用XML编写的用于描述Web服务静态组装结构的形式规约语言。为了使BPEL所描述的Web服务组装能够满足设计人员的设计初衷。人
聚类是数据挖掘中一种非常重要的方法,在模式识别,图像处理和信息提取等领域有着重要的应用。每种聚类算法都有其特有的优势和适合的应用场合。同时,不同的应用有其不同的特点,这
网页一般总是包含很多广告条,导航栏,以及版权声明等信息。这些不相关的信息构成了网页内容的一部分,它们将会严重影响信息检索的效果。研究者们发现一篇网页可以被划分成不同的
随着空间科学任务仿真技术的不断发展,可视化的需求大量增加。同时,显示硬件也在不断发展,这样对可视化的效果和方式也提出了更高的要求。为了满足多种与地球、大气相关的空
企业实施流程管理所带来的好处是非常明显的。这包括提高企业运营效率、改善企业资源利用、提高企业运作的灵活性和适应性、提高工作效率、集中精力处理核心业务、跟踪业务处
随着网络的广泛应用与虚拟机技术的出现,软件保护遇到前所未有的挑战。通过快捷的网络平台,软件产品可在短时间内大范围地传播,以前一对一的非法拷贝,变成大规模并行下载,单