论文部分内容阅读
随着Internet的发展,一方面人们可以通过网络获得大量的信息资源,另一方面虽然现在互联网上有很多搜索引擎可以帮助人们搜索自己想要的信息,但是网上的信息浩如烟海,增长和更新的速度越来越快,从海量信息中找到所需的内容是一项富挑战性的工作.而现有的搜索技术却存在很大的局限性,它仅提供了基于关键字的检索,而忽略了关键字本身所含的语义内容,无法满足用户个性化的需求也不能满足人们方便、快速、准确的获取信息的需要.在这种情况下,传统的基于关键字匹配的搜索引擎已经不能满足用户需求,人们期盼着新的,具有智能处理能力的、结果表示形式更为简洁的新一代搜索引擎的出现.在这种需求的推动之下,本文将自动问答处理技术和Web信息检索技术相结合,以提高现有搜索引擎对信息的智能处理能力,提供更加人性化的人机交互方式,用简洁、准确的答案,自动地回答用户用自然语言提出的问题,帮助人们快速而有效地找到所需的信息.语句相似度计算是自动问答系统的一个关键技术,本文将本体引入到系统中来,利用本体技术构建领域本体.领域本体能提供完整的关于某一特定领域中概念以及概念和概念之间的关系的描述.因此将领域本体作为基础资源,将其比较完整的领域知识和丰富的语义关系应用到自动问答系统中,帮助解决目前自动问答系统中语义理解不足的问题.本文在借鉴现有算法的基础上,提出使用基于本体的语义相似度计算方法,主要讨论并构造了概念之间和问句之间的语义相似度计算模型.概念间相似度算法主要通过对本体中不同概念之间的各个属性进行对比,判别它们在各个属性上的相同与否来得到概念间的语义相似度.在得到概念间相似度的基础上设计问句向量模型,借鉴向量空间计算方法来得到问句间的相似度.从而在自动问答系统中能使用户比较智能快捷的得到自己想要的信息.本论文主要工作可以概括为以下几点:1.研究了自动问答系统中的关键技术,介绍自动问答系统的功能模块.2.研究了本体的相关技术,对本体的概念和建模语言及建模方法进行了较为详细的阐述.3.对现有的词语相似度和句子相似度计算方法进行了研究分析,并指出其在自动问答系统应用领域的不足.将本体引入到自动问答系统中,提出了一种基于本体的自动问答系统的问句间的语义相似度计算方法.将基于本体的概念相似度和基于知网的概念语义相似度计算结合服务于语句相似度.构造了基于本体概念的属性的语义相似度计算方法.并通过测试结果分析所用算法的有效性和正确性.最后结合实际应用,通过构建一个医学领域的“鼻炎”本体模型,设计了一个简单的基于本体的自动问答原型系统.与传统的信息检索相比,给用户提供了更加简洁、方便、人性化的人机交换方式.