基于GPU的复杂SQL查询优化方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：woshizzh1713

【摘要】

：

随着信息技术的发展，数据库中数据存储规模越来越大，呈现出数据量大、数据类型多、价值密度低的特点。在这个背景下，数据库的查询操作从传统的单一维度简单查询扩展为多维度的复

【作者】

：

宋金荣

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2013年期

【关键词】

：

复杂查询压缩列存储 GPU并行计算

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息技术的发展，数据库中数据存储规模越来越大，呈现出数据量大、数据类型多、价值密度低的特点。在这个背景下，数据库的查询操作从传统的单一维度简单查询扩展为多维度的复杂查询。复杂查询作为数据库系统分析数据的重要手段，在实际分析处理数据过程中扮演着重要角色。通过查询请求，企业决策人员能快速获得自己最关注的信息。利用传统的数据库分析手段对海量数据进行提取、存储、分析得到实时结果变得越来越困难，也制约了企业管理者的决策。为了提高大规模数据下多维复杂查询的速度，本文结合了图形处理器并行计算能力和列存储数据库的存储特点，提出了适用于并行查询的列式存储模型以及GPU并行加速查询的策略。本文的主要研究内容如下：（1）研究数据库复杂查询的相关理论和GPU并行计算模型，并总结出传统数据库查询优化技术。重点分析了不同数据库的存储策略和压缩算法；（2）提出一种基于稀疏索引的物理存储模型，模型在列存储的基础上采用分段划分的策略，同时根据GPU特点采用差值压缩算法进行数据压缩处理，并结合GPU高并行计算能力实现对数据的并行压缩；（3）提出一种基于GPU的复杂查询并行执行算法：结合GPU查询原语操作实现对复杂查询的优化。其中重点实现了对范围查询和分组查询的优化，提出了对分组查询结果合并的策略。提出利用流水线调度策略解决实验中存在IO时间过长的问题，一定程度上加快了查询响应的速度；（4）通过实验证明了利用GPU加速压缩算法和查询加速算法的优越性：将本文提出的查询模型和传统数据库采用美国交易处理效能委员会提出TPC-H测试数据集进行对比分析，证明了本文查询模型在大规模数据集下相比于现有GPU数据库取得5-8倍的加速比。

其他文献

基于粗糙集的多分类器组合及其在知识发现中的应用研究

知识发现与数据挖掘究其本质讲是一种机器学习。分类是许多机器学习问题解决的基础。随着科技的不断进步和研究的进一步深入,单分类器已不能满足人们的应用要求,在这种情况下

学位

知识发现数据挖掘粗糙集多分类器

无线数据行业应用中智能终端在嵌入式平台上的设计和实现

无线通信技术和计算机技术不断发展及融合，促进了无线数据业务及其应用的进一步发展。行业市场被认为是无线技术最可能的阵地。由于灵活的应用环境和对企业成本的节省，在银行、

学位

无线数据业务嵌入式系统无线监控系统设计模式uClinux软件设计

无线传感器网络节能和连通目标覆盖算法设计

无线通信技术和计算机网络技术如今正蓬勃发展，得益于此，由无线传感器节点组成的无线传感器网络(WSN)成为了新兴的研究热点。无线传感器节点具有的探测、感知多种信息例如温度

学位

无线传感器网络节能连通目标覆盖

多学科设计优化分布式计算环境的研究

多学科设计优化计算框架是指能实现多学科设计优化方法、包含硬件和软件体系的计算环境。分布式计算是多学科设计优化计算框架的一个重要特征。本文的主要目的就是研究多学科

学位

多学科设计优化分布式计算CORBAJava系统集成

J2EE核心模式的研究与应用

论文主要研究了典型J2EE核心模式，它提供了在J2EE平台上设计和开发的可重用解决方案，并且每种模式都有各自的适用范围。对于这些模式，本文分析了它们的适用范围、解决方式、优势

学位

J2EEEJB设计模式J2EE核心模式

数字视频水印技术的应用与研究

多媒体技术和网络技术的发展,给人们带来了丰富多彩的视听娱乐的数字产品。但是由于数字产品复制不会引起质量下降,因此出现的大量盗版现象严重地损害了生产商和著作者的积极

学位

数字水印小波变换MPEG-2MPEG-4

微博客中的知识条目发现方法研究

随着互联网信息时代的到来，蕴含在海量信息中的知识却相对分散，如何从海量的文本信息中抽取特定的有用的知识，是当下文本处理领域亟待解决的问题之一。微博是目前比较热门的媒体

学位

微博客信息抽取条件随机场词向量聚类算法

基于基因重要性和特异性的癌症通路分析研究

基于通路的基因表达差异分析已经成为识别各种癌症相关通路的通用方法,如已有的基因集富集分析方法GSEA和基因集分析方法GSA。重叠基因降权(PADOG)方法在GSA方法的基础上降低

学位

基因表达谱通路分析基因特异性基因重要性

电信收入保障系统实现的研究-基于7号信令的移动网络信令监测分析合成

随着电信市场竞争的加剧，各大运营商逐渐意识到自己在运营过程中存在很多收入漏洞。收入保障系统正是为运营商提供了一种途径来找出这些漏洞并采取办法来加以弥补。根据调查报

学位

收入保障系统信令系统移动网络信令监测有限状态机电信

可重构的ASP应用服务托管平台研究

传统的信息化应用模式软件开发周期长、成本高、风险大、维护工作繁重，已经成为中小企业信息化的主要障碍，随着电子商务时代的来临，由第三方来提供相关服务的新型信息化应用模式

学位

应用服务提供商(ASP)可重构开发平台软件构件工作流电子商务客户关系管理(CRM)

基于GPU的复杂SQL查询优化方法研究

与本文相关的学术论文