相似度计算在基于本体的自动问答系统中的应用

来源 :中央民族大学 | 被引量 : 0次 | 上传用户:ynsyxs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的发展,一方面人们可以通过网络获得大量的信息资源,另一方面虽然现在互联网上有很多搜索引擎可以帮助人们搜索自己想要的信息,但是网上的信息浩如烟海,增长和更新的速度越来越快,从海量信息中找到所需的内容是一项富挑战性的工作.而现有的搜索技术却存在很大的局限性,它仅提供了基于关键字的检索,而忽略了关键字本身所含的语义内容,无法满足用户个性化的需求也不能满足人们方便、快速、准确的获取信息的需要.在这种情况下,传统的基于关键字匹配的搜索引擎已经不能满足用户需求,人们期盼着新的,具有智能处理能力的、结果表示形式更为简洁的新一代搜索引擎的出现.在这种需求的推动之下,本文将自动问答处理技术和Web信息检索技术相结合,以提高现有搜索引擎对信息的智能处理能力,提供更加人性化的人机交互方式,用简洁、准确的答案,自动地回答用户用自然语言提出的问题,帮助人们快速而有效地找到所需的信息.语句相似度计算是自动问答系统的一个关键技术,本文将本体引入到系统中来,利用本体技术构建领域本体.领域本体能提供完整的关于某一特定领域中概念以及概念和概念之间的关系的描述.因此将领域本体作为基础资源,将其比较完整的领域知识和丰富的语义关系应用到自动问答系统中,帮助解决目前自动问答系统中语义理解不足的问题.本文在借鉴现有算法的基础上,提出使用基于本体的语义相似度计算方法,主要讨论并构造了概念之间和问句之间的语义相似度计算模型.概念间相似度算法主要通过对本体中不同概念之间的各个属性进行对比,判别它们在各个属性上的相同与否来得到概念间的语义相似度.在得到概念间相似度的基础上设计问句向量模型,借鉴向量空间计算方法来得到问句间的相似度.从而在自动问答系统中能使用户比较智能快捷的得到自己想要的信息.本论文主要工作可以概括为以下几点:1.研究了自动问答系统中的关键技术,介绍自动问答系统的功能模块.2.研究了本体的相关技术,对本体的概念和建模语言及建模方法进行了较为详细的阐述.3.对现有的词语相似度和句子相似度计算方法进行了研究分析,并指出其在自动问答系统应用领域的不足.将本体引入到自动问答系统中,提出了一种基于本体的自动问答系统的问句间的语义相似度计算方法.将基于本体的概念相似度和基于知网的概念语义相似度计算结合服务于语句相似度.构造了基于本体概念的属性的语义相似度计算方法.并通过测试结果分析所用算法的有效性和正确性.最后结合实际应用,通过构建一个医学领域的“鼻炎”本体模型,设计了一个简单的基于本体的自动问答原型系统.与传统的信息检索相比,给用户提供了更加简洁、方便、人性化的人机交换方式.
其他文献
本文研究非线性半定规划问题的最优性条件和数值解法。全文包括三个部分。   第一章介绍了半定规划有关的基本知识和最优性理论,对于含等式约束的一类非光滑半定规划问题证
本文通过对荣华二采区10
Domain理论是格序理论与拓扑学的完美结合,不仅成为纯粹数学的一个新的研究方向,也在理论计算机科学中有重要应用. Scott拓扑将序结构和拓扑结构成功的结合到一起,成为连续格
在物理概念引入教学中运用电教媒体手段,可以使概念教学由抽象变具体,由微观变宏观,由静态变动态,从而使教学活动变得生动有趣,富有吸引力。传统的物理概念教学主要存在平铺直叙,缺
本文通过对荣华二采区10
近年来,面对新的形势和任务,余姚市委认真贯彻落实“三个代表”重要思想,坚持以统筹的思路抓党建,不断深化“三级联创”活动,着力构筑基层党建工作的长效机制,使党的基层组织
分类技术是众多应用领域的关键技术,用于分类技术的方法有多种多样。与其它方法相比,支持向量机方法是以结构风险最小化为学习原则,具有较好的泛化能力,且在非线性和样本属性维数
本篇硕士毕业论文主要研究了在高维系统中具有一倾斜翻转的异宿环所产生的分支情况.通过建立局部坐标系并运用Silnikov坐标,导出Poincaré映射和分支方程,把证明原系统是否存
学位
本刊讯9月29日至10月7日,第17届中国(青州)花卉博览交易会暨第11届山东省花卉交易会将在山东青州举行。本届花博会由中国花协盆栽植物分会、山东省花卉协会主办,采取“行业主
当今,数学在社会经济、工程技术中的应用越来越广,人们用数学模型来揭示系统的内在机制,对系统的发展态势进行预测.本文主要是利用数学模型研究现今比较流行的森林病虫害系统.通
学位