论文部分内容阅读
互联网的普及与深入发展,使得网上咨询服务逐渐成为(或已成为)一种重要的信息服务方式;作为网上咨询服务的典型代表——FAQ(Frequently Asked Questions)信息服务,因其便捷、无人值守、时空无阻隔等特性,受到了广泛关注。FAQ即常见问题解答,是一种主要由服务提供方从现有的用户提问中抽取出那些普遍的、常被提及的问题进行定期汇总整理,以便于提供用户自助式浏览或检索的信息服务方式。一般而言,用户可以很方便地在网上通过浏览FAQ找到相关常见性问题的答案。近年来,国内有不少学者开始逐渐关注于如何利用FAQ信息快速搭建实时咨询服务平台,以实现自动回答。其理论假设前提是,用户的提问服从于帕累托法则——80%的提问是由20%的问题唤起的。换句话说,通过归纳问答系统中海量的问答记录捕获那些相对稳定、常见的问答记录,就能满足绝大多数的用户提问,实现自动问答。然而传统意义上的FAQ信息,因主要依托于服务提供方的定期汇总整理,使得它既无法实时响应不断变化的用户需求,又难以支撑问答系统。本文综合运用信息采集、文本挖掘、计算语言学等信息分析领域的理论与方法,以海量的问答记录为主要研究对象,开展FAQ信息的生成机理、组织方式等研究,从而到达减少专家的重复性劳动而专注于回答专业问题的目的。研究主要包括四个方面:首先,介绍了本文的研究背景及意义,国内外研究现状,并给出研究的主要内容及其组织框架。其次,简要概述了问答系统及其与知识库之间的关系,并结合问答信息特征,从问答知识库的基本描述框架及其技术实现细节两个角度,详细描绘了中文问答系统中问答知识库建设活动所遵循的规范及技术可行性。然后,给出基于问答知识库的自动问答模式,并进行了技术实现与实例演示,实证了该模式用于实践的可行性。最后,对上述研究工作做了回顾并给出下一步的研究方向。