面向托管式语言的异质内存管理和优化

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：dian

【摘要】

：

随着数据中心、大数据应用的发展，DRAM(Dynamic Random-Access Memory)技术由于工艺限制，其存储密度增速难以满足计算规模的快速增长。将存储密度大、价格低廉，但性能弱于DRAM的

【作者】

：

王晨曦

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2018年期

【关键词】

：

数据库异质内存编程接口托管式语言

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着数据中心、大数据应用的发展，DRAM(Dynamic Random-Access Memory)技术由于工艺限制，其存储密度增速难以满足计算规模的快速增长。将存储密度大、价格低廉，但性能弱于DRAM的非易失性内存(Non-Volatile Memory,NVM)和DRAM构成异质内存是解决该问题的一个主流研究方向。此时，需将应用中的数据进行冷、热划分，并布局到异质内存中的DRAM和NVM部分。托管式语言，如Java，Scala等，被广泛应用于分布式系统、嵌入式系统等框架的开发。由于托管式运行时自身具有内存管理模块，其往往和操作系统、硬件的的异质内存管理机制策略产生冲突。　　本文围绕“利用托管式运行时系统管理异质内存”的思想，来解决多系统层次同时移动数据造成的冲突问题。针对数据使用行为复杂的单机应用和计算行为规则的大数据应用，本文分别提供了基于程序分析的数据划分策略和数据布局编程接口。最终，该研究基于内存计算框架Spark和Java运行时OpenJDK实现了贯穿大数据应用、大数据框架、运行时系统、异质内存的一体化管理框架。　　本文的创新点主要有:　　·基于运行时系统，针对单机应用提出了一种粗、细两级粒度的冷、热数据划分，并利用GC进行数据布局的方法。本文直接利用运行时堆现有的数据生命周期、数据类型等数据分类，进行粗粒度的冷、热数据划分;本文发现了程序中的物理访存主要由极少量函数造成的现象，并提出了基于函数访存密度(Memory Access Density)的细粒度冷、热数据划分方法。最终，针对Dacapo等程序，在异质内存中的DRAM比例为15％-25％时，和使用与异质内存等量的DRAM相比，仅有5％-25％的性能差。　　·本文对典型内存计算框架(Spark)的迭代计算应用的磁盘开销、GC、计算特征等进行了系统分析，发现其基本单元(RDD)之间具有显著的访存差异和生命周期差异，而单一基本单元内部的众多数据则具有类似的访存行为。基于此，本文提出了一套以自定义数据结构(RDD)为布局粒度的异质内存编程接口。　　·提出了一种跨层的“大数据框架-运行时系统协同”的数据布局策略。通过本文开发的数据信息传递通道，应用开发者对单一自定义数据结构(RDD)进行位置(DRAM、NVM)标注后，标注信息首先在Spark层次中相互依赖的RDD之间进行传播，然后运行时层根据标注信息划分众多孤立的数据对象，并基于该数据划分进行异质内存布局和定向优化。使用本文提出的编程接口对现有Spark应用进行轻微修改，便可以RDD粒度在异质内存上进行数据布局。在使用DRAM比例在25％-35％的异质内存时，可以达到全部使用DRAM时80％-97％的性能。

其他文献

基于UML交互模型的运行时验证方法研究

随着软件产业的迅速发展，软件系统的功能和结构日益复杂，人们对于软件产品的质量要求也越来越高。最常用的程序质量问题检测的技术包括软件测试和形式化验证。两种方法各有优缺

学位

UML交互模型运行时验证程序执行轨迹Aspect软件测试形式化验证

大规模地形数据的快速检索及绘制技术研究

地形渲染是虚拟现实技术中非常重要的一部分，也是计算机图形学一个热门的研究课题。它广泛应用于地理信息系统、战场仿真、飞行模拟、电子地图、地形漫游和游戏娱乐等方面。随

学位

地形压缩实时绘制整数小波变换限制四叉树多分辨率纹理合成

基于kerberos的移动学习系统的私密性保护机制研究

移动学习系统是一个新型的E-learning学习环境，利用移动技术随时随地的特性，为学习者提供更加便利的学习支持服务。在面向职业培训和在岗学习的移动学习系统中，学习资源是一种特

学位

移动学习私密性保护机制学习支持服务职业培训在岗学习加密机制身份认证协议

一种基于区间抽象的数组分析方法

在计算机科学领域中，程序分析足一种自动化地分析计算机程序的行为的重要技术。程序分析技术主要应用于程序的优化和程序正确性验证两个方面。现代编译器常常会利用程序分析技

学位

抽象解释程序分析区间抽象数组分析

基于同步网的BPEL流程的性质分析和工具实现

BPEL（业务流程执行语言）作为一种Web服务组装协议，是使用XML编写的用于描述Web服务静态组装结构的形式规约语言。为了使BPEL所描述的Web服务组装能够满足设计人员的设计初衷。人

学位

Web服务组装业务流程执行语言同步网形式化建模

一种面向客户细分的聚类算法框架的研究与实现

聚类是数据挖掘中一种非常重要的方法，在模式识别，图像处理和信息提取等领域有着重要的应用。每种聚类算法都有其特有的优势和适合的应用场合。同时，不同的应用有其不同的特点，这

学位

聚类算法框架客户细分数据挖掘DBSCAN代表对象决策树

基于主题块检测的网页正文提取技术研究

学位

网页块聚类主题块检测数据挖掘正文提取

实时大气渲染在空间科学仿真可视化中的应用

随着空间科学任务仿真技术的不断发展,可视化的需求大量增加。同时,显示硬件也在不断发展,这样对可视化的效果和方式也提出了更高的要求。为了满足多种与地球、大气相关的空

学位

实时大气渲染GLSL瑞利散射米氏散射光学深度光线投射法

基于分布式工作流的安全传输机制的设计与实现

企业实施流程管理所带来的好处是非常明显的。这包括提高企业运营效率、改善企业资源利用、提高企业运作的灵活性和适应性、提高工作效率、集中精力处理核心业务、跟踪业务处

学位

分布式工作流安全传输异常处理E文本加密数据同步

基于程序切片规则的软件水印研究

随着网络的广泛应用与虚拟机技术的出现,软件保护遇到前所未有的挑战。通过快捷的网络平台,软件产品可在短时间内大范围地传播,以前一对一的非法拷贝,变成大规模并行下载,单

学位

软件保护软件水印程序切片鲁棒性

面向托管式语言的异质内存管理和优化

与本文相关的学术论文