基于本体的受限领域问答系统研究

被引量 : 0次 | 上传用户：xiongll

【摘要】

：

自互联网问世以来,越来越多的用户依赖于互联网获取信息。随着互联网技术的普及,存在于互联网上的信息日常膨胀,人们对搜索引擎技术的依赖也日趋增加。通用搜索引擎技术的发

【作者】

：

卢宇亮

【发表日期】

：

2010年期

【关键词】

：

信息检索问答系统本体论受限领域隐马尔可夫模型语义相似度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自互联网问世以来,越来越多的用户依赖于互联网获取信息。随着互联网技术的普及,存在于互联网上的信息日常膨胀,人们对搜索引擎技术的依赖也日趋增加。通用搜索引擎技术的发展,已经给人类的生活带来了日新月异的变化,人们可以简单的输入几个词,获取相关信息。然而,通常的搜索引擎技术仍然存在几个方面的不足。一、相关性信息反馈过多且不准确,用户需要花费太多的时间获取所需要的结果;二、只能依靠关键字间的匹配关系,无法准确表达用户的检索需求,因此对自然语言式提问的方式有着十分迫切的需求;三、通用的搜索引擎技术对问题的检索,仍然基于简单的关键字匹配上,尚没有涉及语义的检索。问答系统的优势在于用户能够通过自然语言的方式进行提问,系统返回的不再是网页的列表,而是直接的答案。传统的问答系统以聊天机器人、基于知识库的问答系统和基于web的问答系统三种形式为主。聊天机器人以模式匹配为主要求解策略,不足以针对大规模知识库进行深入的研究;基于web的问答系统以web作为知识获取的信息源,涉及到web抓取的内容,不足以专注于研究语义理解在问答系统中的应用。因此本文基于面向知识库的受限领域问答系统,结合领域FAQ库和本体知识库的问答策略,针对问答系统的主要技术,如词法分析、句法分析、语义推理等进行深入的研究。本文的主要研究工作如下:(一)基于层叠隐马模型的词法分析,在中科院ICTCLAS分词系统的基础上,实现了基于N-最短路径的粗分策略和基于隐马模型的未登录词识别、词性标注模块。并在此基础上,完成以名词、动词、形容词和副词为关键词成分的提取策略,为基于FAQ库的问答策略做好准备。(二)基于LTP的依存文法分析,在哈工大自然语言处理平台的基础上,实现了基于GParser的依存文法分析模块,提取句子的核心结构,并在此基础上,基于模式匹配的方式,完成问句从自然语言到SPARQL查询表达式的生成,为基于本体知识库的问答策略做好准备。(三)基于关键词扩展的FAQ库问答策略,本文在前人研究的基础上,结合传统词形相似度、句长相似度以及基于哈工大同义词林和《知网》语义相似度的方法,提出了一种针对句子关键词成分的相似度计算策略;构建以旅游领域为背景的FAQ库,完成了面向FAQ库的问答模块。(四)面向本体知识库的问答策略,本文在前人研究的基础上,构建了以旅游领域为背景的本体知识库,实现了基于SPARQL的本体查询模块。总结本文的贡献如下:(一)在现有技术的基础上,提出了一种融合策略,结合FAQ库和本体知识库问答技术的优势,实现了以此为框架的受限领域问答系统。(二)在句子相似度计算中,提出了一种组合词形相似度、句长相似度以及基于同义词词林和《知网》的语义相似度相结合的句子相似度计算方法,旨在改善问句相似度计算的准确性。(三)提出了一种从自然语言经过问句依存结构分析,向SPARQL本体查询表达式转化的策略。

其他文献

中国古代书院的文化传播研究

中国古代书院作为中国士人自唐代建立的文化教育组织,其历经千年社会风雨洗礼,与官学和私学互为补充,引起民间和政府双重重视。从读书治学之所的私人空间,到依附科举制成为封

学位

中国古代书院书院功能人际传播中国士阶层公共领域

ZY公司采购管理研究

采购管理,作为连接供应链的基础环节,已经成为企业的一个战略管理职能。现代采购管理的理念发生了深刻的变化,已不仅仅局限于材料成本的降低,企业模式向虚拟化、动态联盟和协

学位

采购管理采购组织采购流程供应商管理

基于功能磁性微纳米材料的低丰度蛋白和肽组学富集新方法研究

在过去的十几年中,蛋白质组学虽然获得了快速的发展,但仍然处于组学研究工作的初期,因为蛋白组样品的的复杂性和蛋白丰度的极大差别远远超过目前任何分析平台的鉴定能力。对

学位

蛋白质组学肽组学内源性肽低丰度富集功能化磁性材料

糖尿病视网膜病变免疫机制的初步研究

研究背景糖尿病视网膜病变(Diabetic Retinopathy, DR)是糖尿病最常见的并发症之一,而近年来,随着糖尿病患者的逐年增多,糖尿病视网膜病变的患者也逐年升高,成为主要致盲性眼

学位

AGEs视网膜小胶质细胞视网膜色素上皮细胞T淋巴细胞MHCⅡICAM-1CD80CD86IFN-γIL-2IL-4IL-10CD69C

上海电网在大受端运行情况下电压稳定性分析

上海电网处于快速发展的中期阶段,并逐步迈向饱和期,在这个过程中,上海电网逐渐体现出典型的大规模受端电网的特征。一般认为,在饱和电力系统的受端电网由于电网输电、供电压

学位

电压稳定BPA网格计算大受端节能调度低压减载

高校人事管理系统的设计与实现

高校人事管理过程中产生的信息是十分巨大的,但目前很多高校人事工作的信息化还停留在Excel阶段,基本采用手工填写、人工传递的落后管理方式,造成填写不规范、附件不齐全、共

学位

高校人事管理数据挖掘C/S结构B/S结构

我国大型零售企业的绿色营销战略研究

信息时代,世界经济正以势不可挡的趋势朝着全球市场一体化发展,企业为了在新的竞争环境中立于不败之地,必须准确识别顾客的需求,达到顾客满意。在中国经济快速发展,经济体制

学位

绿色营销零售企业绿色消费

不同民族2型糖尿病患者体质指数与各生化指标的相关性

目的探究不同民族2型糖尿病(T2DM)患者体质指数(BMI)与各生化指标之间的相关性。方法收集2011—2016年新疆医科大学第一附属医院内分泌科2 012例确诊为T2DM患者资料,通过统计

期刊

不同民族2型糖尿病体质指数生化指标相关性

再制造环境中发动机零部件清洗流程改进及绩效研究

世界范围内的再制造行业在实施生产管理的过程当中,由于再制造零部件行业本身具有多品种,小批量的生产特点,并且质量要求很高,要求达到新品的标准,大多数企业习惯上采用推动

学位

再制造生产流程过程体系清洗技术

大孔树脂吸附黄柏总生物碱的理论和应用基础研究

出现于20世纪60年代的大孔树脂吸附技术,以其操作工序简单,溶剂单一,污染小,且产品的纯度高等独特的优越性,广泛应用于中药有效成分的分离纯化。人们对该项技术做了大量的理

学位

大孔树脂黄柏总生物碱动力学热力学

基于本体的受限领域问答系统研究

与本文相关的学术论文