基于近数据处理的数据库管理系统性能优化研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户：whywxh

【摘要】

：

为了应对数据爆发式增长带来的数据等待问题,数据中心迫切需要提高数据处理能力。其中海量数据从存储设备向主机进行数据传输是大规模数据处理的瓶颈之一,近年来得到大量关注

【作者】

：

熊祯

【出处】

：

华侨大学

【发表日期】

：

2020年01期

【关键词】

：

近数据处理数据库远程过程调用存储引擎查询优化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了应对数据爆发式增长带来的数据等待问题,数据中心迫切需要提高数据处理能力。其中海量数据从存储设备向主机进行数据传输是大规模数据处理的瓶颈之一,近年来得到大量关注。近数据处理提出了将计算下移到离存储更近位置的方式来解决数据传输等待问题。作为数据处理和存储最频繁的应用,数据库是进行近数据处理研究的良好载体。为应对数据等待的挑战,以近数据处理为框架,利用新型存储设备计算能力、高带宽、低延迟的特性,进行数据库优化成为热点。本文通过设计远程过程调用(Remote Procedure Call,RPC),实现了数据库系统存储引擎的分离,并提出了近数据处理框架下的数据库优化方法。从性能、功耗和可靠性上解决了大规模数据传输带来计算资源的损耗问题。本文的具体研究内容如下:(1)近数据处理框架是实现数据密集型计算向存储节点转移,减少频繁数据传输带来系统损耗的关键。为保证数据库能够支持近数据处理的模式,需要选择合理的通信协议使主机与存储器之间的计算任务能够协同运行。由此,提出了基于RPC通信的数据库协同处理方法。通过分离数据库的存储引擎,使之独立运行在存储设备系统中,从而能支持数据密集型计算的下移。理论分析和实验表明,待处理数据达到一定规模时,近数据处理极大地减少了数据传输损耗,能有效提高数据库系统处理数据的性能。(2)为进一步提高近数据处理框架下的数据库处理性能,提出了一种数据密集型算子优化方法。其基本思路是将数据密集型计算相关的算子分离后选择性地下移。算子选择和分离能减少数据逆向传输,缓解存储器的计算压力。在此基础上,结合存储引擎分离模式提出数据库算子下移处理方法。通过实验分析证明,该方案能避免不必要的计算下移。通过减少算子调用过程中的数据传输,从而整体上提高数据库系统的计算性能。(3)在对数据密集型算子下移的过程中,传统查询执行器只能根据代价或者经验规则的方式下移相关算子,并不能判断是否采用了近数据处理模式,也不能客观地评估算子是否适合下移。有鉴于此,提出了基于抽样代价估算的近数据处理查询优化方案。在查询引擎生成查询计划之前,采用主机端抽样获取查询操作的过滤效果。再通过代价估算的方式,对采用数据密集型算子下移的查询计划与原有查询计划进行比较,选择性地执行近数据处理方案。实验结果表明,本方案在原有方案的基础上,能够有效选择合适的查询计划,提高数据库系统查询处理效率。

其他文献

基于无人机摄影的数字辛集地理空间框架建设三维数据采集方案设计

地理空间框架属于我国空间信息基础建设的重点项目,促进我国经济社会信息化的发展。地理信息数字化为社会发展、民众生活带来有力的辅助和支撑。而数字辛集地理空间框架建设

学位

数字辛集地理空间框架摄影测量无人机数据采集质量检测

多种再分析资料中热带气旋潜在生成指数分析和初步应用

热带气旋潜在生成指数(GPI,Genesis Potential Index)是热带气旋生成可能性大小的空间分布函数,该指数包含了850hPa绝对涡度、600hPa相对湿度、垂直风切变和最大潜在强度四个

学位

热带气旋潜在生成指数再分析资料

面向医疗云数据的公开审计技术研究

为了有效利用云计算技术提供高质量医疗服务,医疗数据被外包至医疗云中进行存储和管理。但是,将医疗数据外包给云仍存在着诸多安全问题。其中如何保护医疗云数据的完整性是重

学位

云审计医疗云数据完整性电子健康档案无线医疗传感网络

滇东北、滇中地区现代花粉/炭屑组合与植被/火灾关系

“现在是了解过去的钥匙”。了解现代花粉组合与植被和气候的关系以及现代炭屑与森林火灾的关系,是根据化石花粉/炭屑记录重建古植被、古气候和古火灾的依据。为此,本研究在

学位

滇东北滇中湖泊表层花粉谱炭屑植被火灾

基于音视频的跨模态说话人检索和识别

基于音视频的跨模态检索和匹配是一项寻找人脸和语音之间对应关系的任务,大量认知科学方面的研究已经证实了人类拥有匹配同一人的面部信息和声音的能力,这对于创建自然的人机

学位

跨模态检索人脸语音匹配自编码器自注意力机制长短时记忆门网络

基于脉冲神经膜系统的配电网可靠性评估研究

配电网的可靠性评估是对配电网供电性能进行评价的重要方式之一,非时序方法和时序方法是对配电网进行可靠性评估的两类主要方法。脉冲神经膜系统是生物计算的一种分支类型,其

学位

配电网脉冲神经膜系统可靠性评估自突触星形胶质细胞

基于基片集成波导的多模多频带滤波器的设计与研究

射频滤波器是射频通信电路中不可缺少的无源器件之一,射频多通带滤波器可以有效增加滤波器的使用效率,减少滤波器的体积,近年成为射频滤波器的研究热点。本文基于基片集成波

学位

滤波器基片集成波导多模多频带小型化

Ka波段双层结构微带环行器的设计与仿真

环行器作为微波通信系统中的组成部分,主要用于通信信号的接收和发射,具有不可替代的作用。随着移动通讯技术的飞速发展,环行器的小型化、平面化、集成化成为目前环行器的重

学位

环行器铁氧体薄膜双层薄膜结构微带

基于生理信号的智能轮椅使用者路径偏好识别

随着老龄人口、各种慢性病患者和意外伤害事件的增加,同时新生人口数量的降低,我国人口正面临老龄化的挑战。越来越多的失能半失能、失智半失智的人群,给家庭及社会造成巨大

学位

人机交互智能轮椅情绪识别沉浸式虚拟现实生理信号

用低温压力诱导流动成型法提高PA6\PP的力学性能及其微观结构的研究

随着塑料产业的快速发展以及塑料应用领域的大大拓展,塑料的加工成型工艺受到越来越多的重视,迫切需要探索出新兴的加工成型工艺能减少能耗、降低成本,甚至获得高性能的材料

学位

塑料加工成型工艺压力诱导流动成型PIFPA6\PP贝壳

基于近数据处理的数据库管理系统性能优化研究

与本文相关的学术论文