中文问答系统中问题理解和答案抽取的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:niwai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答系统是集自然语言处理技术和信息检索技术于一身的新一代智能搜索引擎。与传统的搜索引擎相比,问答系统能更好的满足用户的查询要求,更准确地检索出用户所需要的答案。问答系统包括问题理解、查询扩展、文本检索、答案抽取和答案排序,其中,问题理解和答案抽取最为关键。本论文利用自然语言处理技术,研究中文问答系统中的两个关键技术:问题理解和答案抽取。   问题理解是中文问答系统的基础,只有在正确地分析和理解问题的基础上,才有可能返回给用户以正确的答案。问题理解的核心内容是问题特征的抽取和问题分类。本文在前人研究的基础上做了如下工作:(1)针对中文问句的特点,对问句的疑问词和疑问意向词进行分析和提取,并利用知网对疑问意向词进行扩展;(2)利用“问句统一型”表示问句的句型,提高系统处理多种表达形式问句的能力;(3)对问句进行语义角色标注,建立问句的语义角色框架,加强系统对中文问句的语义理解;(4)对问题分类器进行分析,提出利用改进的贝叶斯模型作为分类器,并利用实验对不同的问题分类器进行比较,实验结果表明本文的分类器方法优于其他模型。   答案抽取是问答系统中另一个重要的组成部分,其质量直接影响问答系统的性能。本文先对文本进行指代消解预处理,并提出了一种结合问句的关键词位置、问句长度、问句句型、问句语义角色的句子相似度计算方法,对利用该句子相似度计算方法进行答案的抽取。在实验中,将本文的方法与其他句子相似度进行比较,结果表明本文提出的方法取得了较好的结果。   最后,针对问题理解和答案抽取阶段采用的方法,实现了一个简单的问答系统作为开放式领域问答系统的实验平台。  
其他文献
随着信息化建设的推广和普及,各信息系统之间的交互问题愈加尖锐,信息孤岛现象也逐渐严重。为解决异构数据库之间的数据交换问题,我们设计并实现了数据交换系统。   在数据交
Web服务作为面向服务计算范型的主要实现技术,能有效提高异构环境下分布式应用的开发效率,降低其开发成本。而Web服务应用系统的运行时质量保证及优化则可以通过采用监测机制实
利用计算机视觉技术对农产品进行检测与分析,特别是农产品的营养状况检测,对农业生产具有重大意义。因为传统的检测方法对农产品具有破坏性,且处理周期长,速度慢,无法适应大批量检
随着通信技术的不断发展和社会需求的日益增长,传统的单一媒体的通信服务,如电话、传真,已难以满足人们的日常需求。基于宽带网络的视频会议系统把视频、音频、文字等多种媒体信
讲故事作为学校和家庭教育儿童的有效手段,一直是国内外各研究机构的研究热点。目前的很多儿童讲故事软件以各种形式为儿童提供了故事创作工具,但是它们大多不能让儿童相互协作
在信息化建设迅猛发展的今天,机房的规模不断扩大,并且地理位置趋向分散,为了保证各种硬件设备持续稳定地运行,机房管理员的工作也越来越繁重。在对机房的监控过程中,虽然网络和服
复杂背景下的目标实时分割与检测技术是计算机视觉领域的一个重要研究方向,在人机交互、智能监控和虚拟现实等领域具有广泛的应用前景。本文以视频中的目标实时分割与检测技术
学位
许多涉及海量空间数据共享、交换、集成和服务的WebGIS应用系统,如:空间数据集成系统,空间信息共享服务等应用系统,它们以空间信息共享的GML数据格式传输和处理。由于GML空间数据
仿真图像生成技术是计算机图形学研究的一个重要内容,在各个方面都有广泛的应用。在航空航天领域,地面的应用处理常常依赖空间探测器拍摄结果,由于实验成本的昂贵,对探测器拍摄结
随着对等网络(Peer—to—Peer,简称P2P)技术的快速发展,P2P网络已成为互联网上的一个重要应用。P2P网络将互联网上闲散节点通过一定方式组织起来,提供强大的计算与存储能力。P2P