基于近数据处理的数据库管理系统性能优化研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:whywxh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了应对数据爆发式增长带来的数据等待问题,数据中心迫切需要提高数据处理能力。其中海量数据从存储设备向主机进行数据传输是大规模数据处理的瓶颈之一,近年来得到大量关注。近数据处理提出了将计算下移到离存储更近位置的方式来解决数据传输等待问题。作为数据处理和存储最频繁的应用,数据库是进行近数据处理研究的良好载体。为应对数据等待的挑战,以近数据处理为框架,利用新型存储设备计算能力、高带宽、低延迟的特性,进行数据库优化成为热点。本文通过设计远程过程调用(Remote Procedure Call,RPC),实现了数据库系统存储引擎的分离,并提出了近数据处理框架下的数据库优化方法。从性能、功耗和可靠性上解决了大规模数据传输带来计算资源的损耗问题。本文的具体研究内容如下:(1)近数据处理框架是实现数据密集型计算向存储节点转移,减少频繁数据传输带来系统损耗的关键。为保证数据库能够支持近数据处理的模式,需要选择合理的通信协议使主机与存储器之间的计算任务能够协同运行。由此,提出了基于RPC通信的数据库协同处理方法。通过分离数据库的存储引擎,使之独立运行在存储设备系统中,从而能支持数据密集型计算的下移。理论分析和实验表明,待处理数据达到一定规模时,近数据处理极大地减少了数据传输损耗,能有效提高数据库系统处理数据的性能。(2)为进一步提高近数据处理框架下的数据库处理性能,提出了一种数据密集型算子优化方法。其基本思路是将数据密集型计算相关的算子分离后选择性地下移。算子选择和分离能减少数据逆向传输,缓解存储器的计算压力。在此基础上,结合存储引擎分离模式提出数据库算子下移处理方法。通过实验分析证明,该方案能避免不必要的计算下移。通过减少算子调用过程中的数据传输,从而整体上提高数据库系统的计算性能。(3)在对数据密集型算子下移的过程中,传统查询执行器只能根据代价或者经验规则的方式下移相关算子,并不能判断是否采用了近数据处理模式,也不能客观地评估算子是否适合下移。有鉴于此,提出了基于抽样代价估算的近数据处理查询优化方案。在查询引擎生成查询计划之前,采用主机端抽样获取查询操作的过滤效果。再通过代价估算的方式,对采用数据密集型算子下移的查询计划与原有查询计划进行比较,选择性地执行近数据处理方案。实验结果表明,本方案在原有方案的基础上,能够有效选择合适的查询计划,提高数据库系统查询处理效率。
其他文献
地理空间框架属于我国空间信息基础建设的重点项目,促进我国经济社会信息化的发展。地理信息数字化为社会发展、民众生活带来有力的辅助和支撑。而数字辛集地理空间框架建设
热带气旋潜在生成指数(GPI,Genesis Potential Index)是热带气旋生成可能性大小的空间分布函数,该指数包含了850hPa绝对涡度、600hPa相对湿度、垂直风切变和最大潜在强度四个
为了有效利用云计算技术提供高质量医疗服务,医疗数据被外包至医疗云中进行存储和管理。但是,将医疗数据外包给云仍存在着诸多安全问题。其中如何保护医疗云数据的完整性是重
“现在是了解过去的钥匙”。了解现代花粉组合与植被和气候的关系以及现代炭屑与森林火灾的关系,是根据化石花粉/炭屑记录重建古植被、古气候和古火灾的依据。为此,本研究在
基于音视频的跨模态检索和匹配是一项寻找人脸和语音之间对应关系的任务,大量认知科学方面的研究已经证实了人类拥有匹配同一人的面部信息和声音的能力,这对于创建自然的人机
配电网的可靠性评估是对配电网供电性能进行评价的重要方式之一,非时序方法和时序方法是对配电网进行可靠性评估的两类主要方法。脉冲神经膜系统是生物计算的一种分支类型,其
射频滤波器是射频通信电路中不可缺少的无源器件之一,射频多通带滤波器可以有效增加滤波器的使用效率,减少滤波器的体积,近年成为射频滤波器的研究热点。本文基于基片集成波
环行器作为微波通信系统中的组成部分,主要用于通信信号的接收和发射,具有不可替代的作用。随着移动通讯技术的飞速发展,环行器的小型化、平面化、集成化成为目前环行器的重
随着老龄人口、各种慢性病患者和意外伤害事件的增加,同时新生人口数量的降低,我国人口正面临老龄化的挑战。越来越多的失能半失能、失智半失智的人群,给家庭及社会造成巨大
随着塑料产业的快速发展以及塑料应用领域的大大拓展,塑料的加工成型工艺受到越来越多的重视,迫切需要探索出新兴的加工成型工艺能减少能耗、降低成本,甚至获得高性能的材料