分布式RDF数据处理架构研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:liongliong452
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
资源描述框架(resource description framework,RDF)作为语义网提出的数据规范,现已在生活中得到了广泛应用,这导致RDF数据量暴增。虽然当前的分布式RDF数据处理架构能满足SPARQL查询的要求,但局限于改进存储结构和索引结构等方面,高效地执行RDF查询仍是现阶段研究的重点和难点。本文分析了大量分布式RDF数据处理系统,从架构的角度对分布式SPARQL查询技术进行综合的分析,并针对RDF数据的存储方法和SPARQL查询策略这两个影响性能的关键因素进行定义和详细分类。最后,通过实验分析对主流的引擎性能的影响进行定量分析。基于实验结果,总结分布式RDF数据处理系统所面临的挑战和可能解决方案。结合上述分析,分布式RDF数据处理系统仍存在可改进的空间。而且,从硬件角度来看,现有SPARQL查询的方法均依赖于CPU的计算能力。近年来,图像处理单元(graphic processing units,GPU)的发展提高了图数据处理的性能。与CPU相比,GPU多处理器具有高并发、易扩展以及价格成本低等优势。由于CPU处理大规模RDF数据的计算能力有限,本文考虑使用GPU作为系统计算能力的补充。本文提出了基于GPU的RDF查询处理引擎——MapSQ。该系统创新的提出三个模块:查询分割器、基于GPU的MapReduce并行计算模板和计算CPU和GPU的资源管理,以减少SPAQRL查询的响应时间,并在基准数据集LUBM上对该算法进行性能测试,实验结果表明该算法显著优于基于CPU架构的算法。综上所述,本文对于查询效率低下的现状,设计了基于MapReduce的GPU设计了分布式RDF数据查询系统。该系统通过新硬件的加速,大大的提高了系统性能。对RDF数据处理系统中使用硬件加速处理提出了新的尝试。
其他文献
滚水坝是一种高度较低的拦水建筑物,其主要作用为抬高上游水位,拦蓄泥沙。滚水坝在应急抢险中对保护上游桥梁桩基等建筑物起到了决定性作用,介绍了应急抢险中的滚水坝施工技
一、引言构建社会主义和谐社会是我国在今后较长的一个时期的发展目标。建设和谐社会客观上要求中国各地区之间社会经济发展相对平衡。由于我国是一个地域广阔,各地区之间社会
语言的简明化趋势是势不可挡的,法律语言亦是如此。自二十世纪七十年代以来,在英美国家兴起的“简洁英语运动”推动了法律文书语言风格的变化。精确而简明的语言有助于提高法律
随着遥感图像的高分辨率、高光谱和多时相的三高趋势,遥感图像处理必将面临海量数据的处理问题。压缩感知理论因其远低于奈奎斯特采样率的特性,减少了大量的采样数据。基于这
新型内转式进气道设计时首先要选取性能优良的基准流场,然后基于该基准流场,采用流线追踪技术,截面渐变技术,再经过边界层修正得到最终的进气道型面。可见基准流场是设计该类进气
认知心理学及语篇分析理论的发展给外语教学法带来了广泛的影响,大学英语语篇教学日益受到重视。本文以语篇分析理论、认知心理学原理为理论基础来阐述大学英语语篇教学的必要
日光温室产业是我国北方的传统产业,在国民经济中也已形成了一个比较完整的产业体系。近年来,随着国家对农业产业发展的支持,日光温室不断推进产业化、产业结构进一步优化调整,在建设社会主义新农村过程中,如何加快日光温室产业的现代化进程,如何增强日光温室产业发展的综合生产力、增加农民的劳动生产率,并形成可持续发展态势,成为了日光温室产业发展急需研究解决的问题。古浪县作为我国贫困县之一,在发展日光温室产业的道
口述史不仅能帮助再现往事,还能帮助重建历史。取国家级非物质文化遗产项目桑植民歌口述史为研究个案,通过深入田野调查掌握第一手资料,结合文献追踪,对桑植民歌的历史源流、
阿尔茨海默症(Alzheimer’s disease,AD)是一种慢性神经系统退行性疾病,临床主要表现为认知能力下降、记忆力减退,占老年痴呆总数的60-80%。目前市场上治疗AD的药物较少,合成类
目的:优选黑果小檗花色苷的最佳超声提取工艺,确定黑果小檗花色苷中的主要有效成分,研究黑果小檗花色苷中主要有效成分对Aβ25-35诱导PC12细胞构建的AD细胞模型的保护作用及