论文部分内容阅读
本文对中文自动问答系统中的问题理解技术进行了研究。问题理解是问答系统的基础,只有在正确地分析和理解问题的基础上,才有可能返回给用户以正确的答案。问题理解的核心内容就是问题分类。在对现有问题理解技术进行全面学习和深入研究的基础上,本文进行了以下几个方面的工作:
(1)为了深入理解并能从整体上把握问题的语义,本文提出了一种问题语义描述模型一事件框架模型,并采用知网的事件和属性类义原作为事件框架体系的中心成分。
(2)在前人的“问题分类体现问题的疑问意图”思想的基础上,明确地提出了基于疑问意向的问题分类。并在事件框架体系下,给出了疑问意向的形式化定义,即疑问意向可用问题的事件框架中心成分、问题的预期答案类型以及问题中间点的语义角色等三个特征来表征。提出了寄予疑问意向的问题分类体系。同时,本文提出了一种基于事件框架的问题语义描述模型,在这个模型下,我们给出了疑问意向的形式化定义。同时通过借助语义资源知网,对问题空间的大小进行评测。
(3)对问题疑问意向的自动识别进行了研究。提出了一种基于双层最大熵模型的答案类型识别方法,实验结果比采用同一训练测试集的方法高出2个百分点;提出了一种基于知网可信度评价的事件框架中心成分抽取方法,利用该方法能够从表达方式不同而疑问意向相同的问句中提取出相同的事件框架中心成分;利用最大熵模型进行了问点语义角色标注,在此基础上,又对问点语义角色标注中的特征选择及优化进行了深入的研究,并提出了一种基于改进互信息模型的特征选择方法以及一种事件框架特征的优化表达方法。
(4)实现了一个可用于基于模式的问答系统的问题理解子系统,并通过实验对其性能进行了评价。