分布式计算环境下海量RDF数据的skyline查询研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:feng_lingpeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语义网的提出和相关技术的发展与成熟,该领域吸引了学术界、政府部门和工业界的广泛关注和积极参与。关联数据作为语义网的最佳实践,越来越成为研究的热点。资源描述框架RDF现已成为关联数据的实际标准,为网络上的资源提供了一种资源描述标准。通过给万维网上的文档添加计算机能够理解和处理的形式化语义信息,大大提高信息检索的精度和效率。随着RDF数据的不断增多,针对RDF数据的信息挖掘成为数据管理和数据挖掘的研究热点。Skyline查询作为一种典型的多目标优化查询,为用户决策提供参考依据,因而得到了广泛研究。本论文主要研究针对海量RDF数据的Skyline查询。第一,根据RDF垂直存储的方式设计一种候选Skyline点筛选策略,提前修剪部分非Skyline元组,减少skyline支配点计算的数据量;并且在筛选的基础上给出基于MapReduce的Skyline并行化查询算法以提高查询效率。第二,针对高维数据空间下Skyline查询的不足,研究K-支配Skyline查询算法。论文提出两种K-支配查询算法。一种基于支配能力的K-支配查询算法,根据每个数据点的支配能力划分数据块,分别计算局部K-支配点,最后合并计算最终的K-支配点。另一种基于空间划分的K-支配查询算法,通过挖掘数据空间和K-支配的关系,计算支配集合。最后,本论文在大量数据的基础上进行实验,验证所提算法的计算效率。实验结果表明,与现有的Skyline查询算法和K-支配Skyline查询算法相比,本文提出的基于MapReduce的RDF数据Skyline查询算法和K-支配Skyline查询算法有效的提高查询效率。
其他文献
反求工程中,由三维测距仪获取的点云常常存在空洞,给后期的几何建模工作带来很大的困难。本文在已有的边界提取与曲面重建方法的基础上,提出了一种基于点模型的点云空洞检测与修
近年来,Web服务以其协议标准化、低耦合以及平台无关性的优点,在应用集成方面得到了迅猛的发展。随之而来的问题是,如何在海量的Web服务中找到合适的服务,即服务发现,已经成为Web
企业信息门户作为一种信息和应用整合模式,能够有效地整合企业的信息资源和应用系统。它为企业的员工、客户、合作伙伴等提供了一个基于Web的统一平台,在这个平台上,企业门户
语音识别主要指让机器听懂人的语言,即在各种情况下,准确地识别出语音的内容,从而根据其信息,执行人的各种意图。语音识别中,端点检测占有非常重要的地位。在低信噪比环境下,
随着信息时代的到来,网络上的数据呈指数级的增加,由于数据的自治性、异构性和分布性特点,造成“信息孤岛”,数据的复用和共享大大地下降。关联数据的出现解决了这一难题。旅
流媒体以其特有的娱乐性和交互性正在成为推动未来带宽应用的主动力。如何在Internet网络上提供大规模的流媒体内容分发一直是近十年多里流媒体研究领域的核心问题。IP组播让
本文以研究和实现一个易于扩展和维护的具有快速部署能力的银行综合业务系统开发平台为主要目的,总结了平台中的核心技术-MVC模式重用和数据驱动技术,重点介绍了基于设计模式
离群点识别和聚类分析是数据挖掘研究的重要方面,基于离群点分析的各种数据挖掘算法的研究已经成为研究热门方向。但是目前大多数的离群点分析算法只是针对于静态数据集的操
搜索引擎是人们获取海量网络信息的首要工具,是网络研究和应用的关键内容。目前随着Internet信息的爆炸增长以及信息多元化的发展,快速有效地获取需要的相关信息变得越来越困
计算机技术的迅猛发展,给人们的工作和生活带来了前所未有的便利和效率,网络技术的普及又使其如虎添翼,走进社会生活的各个领域,成为人类社会不可或缺的一部分。然而网络攻击