基于知网的中文问答系统问题理解与研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:shanchy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对中文自动问答系统中的问题理解技术进行了研究。问题理解是问答系统的基础,只有在正确地分析和理解问题的基础上,才有可能返回给用户以正确的答案。问题理解的核心内容就是问题分类。在对现有问题理解技术进行全面学习和深入研究的基础上,本文进行了以下几个方面的工作: (1)为了深入理解并能从整体上把握问题的语义,本文提出了一种问题语义描述模型一事件框架模型,并采用知网的事件和属性类义原作为事件框架体系的中心成分。 (2)在前人的“问题分类体现问题的疑问意图”思想的基础上,明确地提出了基于疑问意向的问题分类。并在事件框架体系下,给出了疑问意向的形式化定义,即疑问意向可用问题的事件框架中心成分、问题的预期答案类型以及问题中间点的语义角色等三个特征来表征。提出了寄予疑问意向的问题分类体系。同时,本文提出了一种基于事件框架的问题语义描述模型,在这个模型下,我们给出了疑问意向的形式化定义。同时通过借助语义资源知网,对问题空间的大小进行评测。 (3)对问题疑问意向的自动识别进行了研究。提出了一种基于双层最大熵模型的答案类型识别方法,实验结果比采用同一训练测试集的方法高出2个百分点;提出了一种基于知网可信度评价的事件框架中心成分抽取方法,利用该方法能够从表达方式不同而疑问意向相同的问句中提取出相同的事件框架中心成分;利用最大熵模型进行了问点语义角色标注,在此基础上,又对问点语义角色标注中的特征选择及优化进行了深入的研究,并提出了一种基于改进互信息模型的特征选择方法以及一种事件框架特征的优化表达方法。 (4)实现了一个可用于基于模式的问答系统的问题理解子系统,并通过实验对其性能进行了评价。
其他文献
网格技术的发展,为信息资源的共享提供了更加完善的手段,企业在信息资源共享的同时也要阻止非授权用户对企业敏感信息的访问。访问控制的目的是保护企业在信息系统中存储和处
随着城市交通网络上各种传感器技术的快速发展,人们可以自动地采集并保留路网上大量移动对象产生的交通数据流信息。管理和分析数据流,并从中获得有用信息及随时间演化规律以支
图的标号问题是图论中一个比较新的课题,它可追溯到1950年信号带宽的优化问题:源于主要的非零数字信号通常位于一个比较窄的带宽中。1966年Rosa给出了图标号的一个新的概念--图
鞋楦是制鞋工业中一个重要模具,各种式样的鞋都依赖于鞋楦,鞋楦的生产制造水平在鞋产业中起着非常重要的作用。面对鞋产品日益增长的多变需求,传统的作坊式生产已不能满足需要。
在某些现代化物流和生产加工等环境中,存在一种具有多个智能机器人(或手臂)协同工作的搬运系统。机器人连续和高速的运转会导致其传动装置过热疲劳,发生故障甚至烧毁。因此,
随着网格技术的快速发展,其应用领域越来越广泛,网格应用规模越来越大、也越来越复杂。复杂的网格应用存在各种各样的约束和资源竞争问题。把工作流引入网格——网格工作流,
当前,随着计算机软件快速发展、软件规模不断扩大,软件的质量越来越得到重视。为此,人们提出了软件可靠性、软件验证、软件质量保证、软件测试等一系列概念和理论。如何提高
电子投票以密码学为基础,运用计算机和网络技术来实现投票功能。使用电子投票,不仅仅可以避免以往大量组织、选票收集和计票的工作,而且也可以有效地减少人为因素。与传统的
随着信息技术的不断发展,企业管理水平的不断提高,利用信息技术融合管理思想的信息管理系统的开发和使用,越来越受到企业的重视,信息系统既能够方便快捷的完成日常生产管理工作,同
随着科技的进步,人类对信息的获取、表示、存储、传播和再现提出越来越高的要求。在数字视频领域,人们对显示的分辨率和实时性要求越来越高,当前主流的单一显示器已经远远不