基于中文自然语言理解的问答系统研究

被引量 : 0次 | 上传用户:gw678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问题回答系统是近年来自然语言理解中的重要研究方向,也是自然语言理解的一种实际应用。本文在现有问题回答系统研究的基础上,以概念图为主要知识表示方式,从汉语自然语言理解方面,研究问题回答系统的结构、主要算法和执行效率。在问题回答系统的研究中,知识表示方式至关重要。为了增强语义表达能力和知识推理能力。本文采用概念图知识表示方法,将简单、直观、语义表达能力强的概念图知识表示和传统问答系统相结合,构建基于概念图的中文自然语言理解问答系统。本文在基于概念图知识表示的问答系统中,主要改进了问题理解、文本搜索和答案抽取三个模块的性能,设计了自然语言转化为概念图的NL-T-CG (Naturallanguage transform conceptual graphs)算法、概念图语义搜索算法和概念图聚类答案抽取算法。首先,在NL-T-CG算法中,利用隐马尔可夫分层的方式对语句实现分词处理,再进行词汇标注和语法分析,根据分析结果中词语的语义关系和语句关系,设计概念图生成算法。其次,在概念图语义搜索算法中,将经过输入检查的问题概念图,以概念图投影匹配的方式对问题和相关语料进行初步匹配。其后,再检查概念图的结构相似度和概念图的语境匹配契合度,并根据匹配后的候选答案集构建概念图语义搜索算法。最后,在概念图聚类答案抽取算法中,使用概念图聚类的方式自动识别答案类型。经过对匹配适应度的排序以确定答案抽取的结果,算法将智能算法和聚类算法相结合,改进概念图聚类的过程,设计概念图聚类答案抽取算法。在以上研究的基础上,本文实现了一个基于中文自然语言理解的问答系统,该系统能接收中文语句的查询,经过问题理解、文档搜索和答案抽取,最后输出简单直观的自然语句。经过对系统的调试、实验和测试,并同理论推理后的结果进行对比分析,本问答系统准确率达到51%,相比传统的问题回答其能力平均提高了6%。本系统已应用到Platform2.0云平台的项目研究中,并取得满意的效果。
其他文献
目的:探讨快速康复措施应用于结直肠癌围手术期的临床疗效。方法:根据入组条件选取32例拟行结直肠癌根治手术患者,随机分为快速康复(FTS)组和传统治疗组,分析比较接受两种治疗
Gov2.0是利用以Web2.0技术、移动通信技术为代表的新一代信息通信技术的发展成果,旨在改变政府与公众单向信息交流的现状,为政府与公众交流搭建一个开放、透明、互动、高效的一
近年来,由于地铁突发事件本身所具有的特点,它不仅不容易被觉察和控制,而且一旦发生突发事件就会造成不可预料和避免的严重后果,以至于地铁突发事件造成人身安全和财产损失的
核糖核酸酶A超家族是一类可以水解RNA的核酸内切酶,其同源基因通常在染色质上成簇排列。核糖核酸酶-4(Ribonuclease-4, RNase-4)和血管生成素(Angiogenin, ANG)作为超家族的
高校后勤作为高等教育教学、科研的保障部门,能否充分发挥其职能直接影响到学校教学、科研工作的正常开展。近年来市场经济体制不断发展完善,社会需求层次不断提高,提高高校
市场上智能社区的设计方案层出不穷,经调研,现有的智能化社区管理多采用总线制来实现传感网通信,软件架构也多以客户端/服务器(C/S)类为主,这类系统通常设计复杂,对现场设备要求较多
土遗址是不可移动的文物,具有极其重要的历史、文化和科学价值。其在我国分布范围广且破坏严重,因此,对土遗址的保护与展示一直是我国文物保护部门工作的重点和难点所在。遗址博
马来西亚是海外华文教育最发达的国家,它经历了各时期政府对于华文教育抵制的艰苦岁月,如今已经发展成为学前到大专的比较完整的华文教育体系。虽然近年来中国国内研究者、学者
随着中国现代化建设日新月异的发展,城市建设经历了一个从建筑地域性特色丧失、千城一面的阶段向建筑本土化,将传统与现代合理融合的阶段发展的过程。而如何更好的促进传统与现
无线传感器网络是一种全新的信息获取和处理技术,它集成传感器技术、嵌入式计算技术、网络技术和无线通信技术。它能够协作地感知、采集和实时监测各种对象或环境的信息,并传