【摘 要】
:
RDF已被广泛的用于表示Web上的信息,而SPARQL则是用于操作RDF数据的标准查询语言。一个SPARQL查询中通常存在许多JOIN操作,这是SPARQL查询处理效率的瓶颈。此外,真实的RDF数
论文部分内容阅读
RDF已被广泛的用于表示Web上的信息,而SPARQL则是用于操作RDF数据的标准查询语言。一个SPARQL查询中通常存在许多JOIN操作,这是SPARQL查询处理效率的瓶颈。此外,真实的RDF数据集经常显示出强大的数据稀疏特性,但是数据本身的特性在数据存储层面经常被忽略。而且,关于RDF数据在GPU平台上的查询处理也是目前被认为是提高查询效率的一个重要途径。在本文中,我们基于GPU以及RDF数据的本身稀疏特性来高效处理RDF数据的SPARQL查询处理以及优化。首先,我们提出了一种基于稀疏矩阵的RDF图数据存储模式,该模式在存储上引入基于谓词的哈希索引,通过仅存储有效边来提高RDF数据集的存储效率。其次,我们提出了一种基于稀疏矩阵的SPARQL查询优化方法并设计了一个查询计划生成算法,该方法充分考虑了JOIN操作的查询代价优化和RDF图数据的稀疏特性,通过累加整个SPARQL查询过程中可能产生的所有中间结果来分析总体的查询代价。第三,我们在GPU上开发了一个可扩展的基于稀疏矩阵的SPARQL查询中的核心JOIN算法,用于并行化加速SPARQL查询处理的查询效率。最后,为了说明JOIN算法在GPU上的查询加速性能,我们在CPU环境下实现该JOIN算法作为一个比较基准来验证该算法在GPU上加速的性能效果。实验结果表明,在基准RDF图数据集上,我们的方法与现有RDF引擎的方法相比,更能显著提高SPARQL查询处理效率并且具有高可拓展性。而且该JOIN算法在GPU平台相比CPU的加速比达到7倍左右。综上所述,我们专注于RDF数据的稀疏特性构建RDF数据的高效存储模式。在查询处理方面,我们将传统的关系型JOIN操作转化为了可供GPU平台并行计算的矩阵运算,这为RDF数据的高效查询引入了一个新的解决方案。
其他文献
[目的]研究眼睑手术前后睑板腺的炎症因子含量变化及睑板腺组织形态结构改变。从而探讨眼睑手术对睑板腺结构功能的影响。[方法]选择成年清洁级新西兰兔22只,体重约2-2.5kg,
厂房是水电站主要建筑物之一,随着机组运行水头和单机容量的增大和厂房振动控制要求的提高,蜗壳结构的承载能力及厂房结构的抗振能力越来越受到重视。垫层蜗壳结构的承载能力
目的比较不同输血方式在人工全髋关节置换术中应用的安全性和有效性。方法1.将70例全麻下人工全髋关节置换术患者随机分为自体组和异体组,每组各35例。自体组患者术前3-5天采
中华人民共和国成立初期,为缓解财政困难,支援朝鲜战争,积累社会主义建设资金,中央人民政府号召在全国范围内开展群众性的以经济活动为主的增产节约运动。晋华纺织厂响应中央政府的号召,根据不同时期的形势和任务开展了自上而下的增产节约运动,促进了晋华纺织厂恢复和发展生产,建立健全了各项管理制度。本文以晋华纺织厂1950-1957年的增产节约运动为研究对象,对增产节约运动具体实践的状况做了梳理和研究。论文除绪
随着传统能源的日渐枯竭以及全球生态环境的恶化,大力发展以风电、光伏为代表的可再生能源,推进能源转型,已成为当前全球能源发展路线的共同特征。在间歇性可再生能源大规模
铜矿是我国国民经济中的重要组成部分,随着易回收的硫化铜矿物开采枯竭,人们不得不将研究的重点放于贫、细、杂的氧化铜矿物。孔雀石是主要的氧化铜矿物之一,对于孔雀石的回
本文“随州花鼓戏传统剧目与现代剧目的演唱技法对比分析”,以《赵五娘吃糠》《公路孝女》为例,研究的主要内容及解决的主要问题包括:随州花鼓戏历史、现状及音乐特点,并通过
[目 的]检测不同严重程度阻塞性睡眠呼吸暂停(Obstructive sleep apnea,OSA)患者、非阻塞性睡眠呼吸暂停正常对照组外周血清中Toll样受体4(Toll-like receptor4,TLR4)的表达
在对坝址区进行实际地质调查的过程中发现,坝址的平硐及坡表的岩体因为受到了强烈的风化及卸荷作用而显得较为破碎,边坡局部区域的岩体稳定性极差,有的已经发生了明显的变形破坏。这些岩体的破坏都受到了由卸荷引起的长大卸荷裂隙的切割,而这些卸荷裂隙往往都是控制边坡岩体乃至整个山体稳定性的控制性结构面,它们对坝址区边坡的稳定性做作用对工程的安全施工起到了重要的影响。为了对工程的安全施工提供参考意见,本文在的对坝
本文基于市级公安机关大数据信息化建设需求,规范各协同单位信息化工作流程和操作要求进行系统化设计和实施。系统采用B/S访问模式、主流Spring MVC架构的电子工作流引擎,实