论文部分内容阅读
随着人工智能的发展,尤其是对信息技术研究的深入,如何从海量信息中提取出用户需要的知识成为了一个热门的研究方向,随之而来,诞生了一大批信息检索系统,传统的使用浏览器搜索引擎的检索方式已经很难满足用户的需求,智能问答系统的出现使得用户更容易获取到有用的信息。但是现在对智能问答系统的研究还在初期,只能对一些常见问题进行回答,而且对问句的处理也比较简单,对专业领域比如金融、医疗、电商等专业性较强的问题的回答很难得到用户满意的效果。本文通过对现有的智能问答系统相关技术进行总结,发现系统实现的难点在于如何根据问题领域构建相应的知识库和检索方法,如何准确的从用户提问中解析出查询语义,如何将问题的查询语义映射到相应的检索规则,然后从知识库中获取答案。本文的研究主要是针对这三点进行,其具体内容如下:知识库的构建是根据查询问题相关的领域知识完成的,针对领域知识具有偏结构化、关联性强的特征,本文将领域知识存储在关系型数据库中,用本体把数据的概念、属性和联系抽取出来,这样本体的内容只是知识库中实体的领域含义和相关联系,而不包括整个知识库实例,给本体的建立和知识库的维护提供了很大的便捷。而且由于领域知识相关的查询具有语义理解能力强的特征,问题对应的实体或者属性描述都比较明确,本文将查询问题的查询结构抽象成相应的查询服务,以此来建立知识库的检索方法。问答系统的一般都是通过语音来提问,现有的问答系统大都是默认语音输入法识别准确无误,但实际上对于一些专业问题,由于专用名词存在中英文混杂、新词多和缺乏对应的词汇知识库的情况,再加上口语查询的存在发音不标准等原因,造成了输入法的语音识别出错,本文针对这种情况提出了一种基于声韵母的文本纠错并结合条件随机场实体标注的方法,通过这种方法来准确的识别问句中语义。根据领域知识的层次性和关联性,本文提出了一种改进的服务匹配方法,该方法通过领域概念关系来判断服务参数概念的匹配度,并通过查询特点使用服务描述的非必要属性来提高服务查询的精度并降低待匹配服务的范围。并且考虑查询具有上下句相关联的情况,本文将查询的结果以结构化形式保存,并根据相应的查询条件,确定是否在下次查询中使用。基于以上研究,本文提出了基于服务匹配的智能问答系统实现框架,该框架分为三个模块:知识梳理、问题解析、服务检索与查询上下文管理模块。为了验证本框架的实用性,本文在“国民经济大数据问答系统”中应用该框架,综合来说,整个应用过程取得了良好的效果,证明了本文所提出的框架是有效可行的。