论文部分内容阅读
传统信息查询技术都是基于关键字的语法匹配和全文查询技术,但是存在很多问题,例如“忠实表达”问题,机械匹配问题,“词汇孤岛”问题,无法准确揭示信息的实质内容等。语义检索是一种基于知识的、语义上的检索,以语义理解为基础,将用户的检索请求、检索对象资源和检索结果都赋予一定的语义,能够有效地提高查准率。本文在现有语义检索的基础上,结合各种词典和自然语言处理技术,提出了基于自然语言理解的本体语义信息检索。本文首先利用同义词定义模式定义相应的抽取规则,从相关资料(例如百度百科)中获取领域本体的同义词。其次采用Jena推理机,结合领域知识自定义推理规则得到了隐含的知识。在同义词词林的基础上,提出了词语相似度算法,对用户输入的自然语言查询进行语法分析、语义分析、构建SPARQL查询语句实现了自然语言查询。在衡量排序算法的合理性上提出了准确度偏差公式,并对用户交互的内容进行了分析。最后在查询结果中返回丰富的信息,有助于用户了解查询的内容以及实现二次查询。本文实现了以计算机本体为例的语义信息检索,实验表明本文的方法能够获取语义信息,有效地提高了系统的查准率。