论文部分内容阅读
2001年万维网之父蒂姆?伯纳斯-李和他的同事在《科学美国人》上面发表的一篇科普性的文章《The Semantic Web》标志着语义万维网的诞生。语义万维网至今己经发展了十几年的时间。语义数据特点是结构和语义。常见的语义数据是RDF数据。结构化查询语言是访问语义数据的标准查询语言,例如SPARQL查询语言。怛是这种结构化查询复杂的语法阻碍了语义搜索的推广。普通用户习惯于使用简单的关键字查询。虽然它在表达能力上如结构化查询语言。但是因为它快捷方便的强人优势,使得被现有的搜索引擎广泛使用。 如果用户能使用关键字查询来访问RDF数据,可以使得用户不需要掌握学习曲线很陡峭的结构化查询语言,同时用需要理解复杂且可能快速演进的数据模式。在近几年中,把关键字转换成SPARQL查询得到了广泛的研究。现有的方法主要分为两类,一类是基于原始的RDF实例图的方法(基于RDF实例图方法),这类方法通常能得的准确的结果,代价是运行时间会很长。另一类是基于模式图的方法(基于模式图方法),这种方法能人人加快转换的速度,侃是通常精度会很低。在这篇论文中,我们提出了一个创新的方法,这种方法基于一个混合图,这个混合图能平衡转换的准确度和转换的效率。对于给定的RDF图,我们还定义了一个计分函数,这个函数能用来评估转换准确度和效率之间的权衡。这个函数能指导整个混合图的生成。在这个混合图h.我们实现了一个把关键字转换成结构化查询的框架。在三个不同类型的数据集上做了实验,实验表明我们的方法对于基于实例图的方法在准确性下降不多的惜况下效率是上有很大提升,对于基于模式图的方法在效率下降不多的情况下准确性有很大提升。