论文部分内容阅读
随着语义Web的迅速发展,语义Web中的信息量呈现爆炸式的增长趋势,如何从海量信息中快速、准确的获取有用信息成为一个热门课题。RDF(Resource Description Framework,资源描述框架)作为语义Web中通用的元数据模型标准,RDF格式的数据也越来越被广泛使用,因此RDF查询技术的发展直接影响到语义Web的发展程度。目前已经有多种RDF查询技术,并且SPARQL查询语言已经被W3C(World Wide Web Consortium)认定为RDF查询的推荐性标准语言,但是目前的RDF查询技术还存在一系列问题。一方面,由于语义Web中信息的隐蔽性,仅仅通过RDF查询技术无法对RDF信息进行深层次的扩展推理。另一方面,普通查询用户并不具备RDF相关知识,在进行RDF查询时使用的查询条件是模糊的、不确定的,这一系列的因素都会导致查询结果过少或者为空等问题。针对这些问题,本文将推理机制与RDF查询技术相结合,提出了基于推理机制的RDF本体查询方法。本论文的核心内容为:以传统的RDFS(RDF Schema)推理为基础,设计并实现RDF查询中的RDFS推理算法,并且对查询后的大量结果集进行排序。首先,深入分析现有的RDFS蕴含规则,根据规则中涉及的三元组类型以及属性之间的转换关系,对推理规则进行优化处理,得到最优的执行顺序,并以此为基础设计优化后的推理算法。其次,将语义距离的概念引入到RDF查询重写中,对查询重写进行优化处理,降低查询重写的时间和空间复杂度。然后,针对如何从查询后产生的大量RDF三元组中选取最贴近用户需求的信息等问题,本论文采用了基于TA算法的Top-k排序算法,该排序算法通过贴近度概念来计算综合评分函数,可以快速返回满足用户需求的信息。最后,对本文中提出的RDF查询方法进行实验验证,并根据实验结果进行对比分析,实验结果表明本论文提出的基于推理机制的RDF本体查询方法切实可行,并且在查询查全率以及查询查准率上具有较好的性能。