论文部分内容阅读
问答系统(Question Answering System,QA)是信息检索系统的一种高级形式。它能用准确、简洁的自然语言回答用户用自然语言提出的问题。其研究兴起的主要原因是人们对快速、准确地获取信息的需求。问答系统是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。 本文对中文自动问答系统中的问题理解技术进行了研究。问题理解是问答系统的基础,只有在正确地分析和理解问题的基础上,才有可能返回给用户以正确的答案。问题理解的核心内容就是问题分类。在对现有问题理解技术进行全面学习和深入研究的基础上,本文进行了以下几个方面的工作: 1.为了深入理解并能从整体上把握问题的语义,本文提出了一种问题语义描述模型—事件框架模型,并采用知网的事件和属性类义原作为事件框架体系的中心成分。 2.在前人的“问题分类体现问题的疑问意图”思想的基础上,明确地提出了基于疑问意向的问题分类。并在事件框架体系下,给出了疑问意向的形式化定义,即疑问意向可用问题的事件框架中心成分、问题的预期答案类型以及问题中问点的语义角色等三个特征来表征。 3.对问题疑问意向的自动识别进行了研究。提出了一种基于双层最大熵模型的答案类型识别方法,实验结果比采用同一训练测试集的方法高出2个百分点;提出了一种基于知网可信度评价的事件框架中心成分抽取方法,利用该方法能够从表达方式不同而疑问意向相同的问句中提取出相同的事件框架中心成分;利用最大熵模型进行了问点语义角色标注,在此基础上,又对问点语义角色标注中的特征选择及优化进行了深入的研究,并提出了一种基于改进互信息模型的特征选择方法以及一种事件框架特征的优化表达方法。实验结果表明通过特征选择及优化能够有效地提高问点语义角色标注的正确率。 4.实现了一个可用于基于模式的问答系统的问题理解子系统,并通过实验对其性能进行了评价。