论文部分内容阅读
随着互联网和信息检索技术的发展,人们频繁的使用互联网搜索信息。互联网上所普及的在线百科词条与基于关键字匹配的检索技术的组合,一定程度上满足了人们获取信息的需求。为了能够重用已创建的知识库和提高检索的扩展性等诸多目的,语义网的支柱技术本体和本体查询技术得到了研究者们的越来越多的关注及应用。本体是形式化的,对共享概念体系的明确而又详细的说明,它能通过本体元素准确的描述概念和知识。然而,为了使用本体,用户需要了解本体和本体查询语言,这对普通用户并不友好。本文提供了一个友好的方式:用户在本文所提供的查询接口输入中文自然语言问句,系统自动实现自然语言问句到本体查询(例如,SPARQL查询)的转换,然后执行相应的查询获取查询结果。 本文提出了基于规则的自然语言问句映射为查询三元组的方法,利用语言技术平台解析出问句的标注三元组,对问句集的标注三元组进行统计和分析后总结出用于把标注三元组映射为查询三元组的六条启发式规则,利用这些规则去掉了无意义的标注三元组、组合意义不完整的标注三元组。查询三元组经过个体映射、类映射和属性映射得到本体三元组。根据问句答案类型的不同把问句归为三类查询。根据问句的查询类型和问句的本体三元组构造出类型相符的SPARQL查询。实验验证了所提出的方法是有效的。