基于用户意图分析的交互式问答技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:tp137907226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着海量网络信息的积累和规模的高速增长,准确快捷地找到自己所需要的信息已成为人们迫切的需求。自动问答系统,通过理解用户自然语言形式的问句,返回答案或包含答案的文本片段,在一定程度上提高了用户信息检索的效率和准确性。自动问答认为用户的每一个输入都是语义信息完整、独立于上下文语境的问句。另外,自动问答系统对相同的问句总是分析出相同的信息需求,并且应该返回相同的答案,而忽视了不同用户的检索意图之间存在的差异。  但是,在真实的应用环境中,用户往往需要通过与系统进行自然的、连续的、上下文相关的信息交互,以解决各种复杂的信息任务。用户的输入除了以信息检索为目的的问句外,还有关于系统功能的咨询、对系统回答的反馈等表达其他意图的对话;后续问句中往往会出现基于上下文语境的信息缺省现象,例如指代、省略等等;对于同一个问句,由于用户提问的意图不同,所表达的信息需求也不同,进而,所需要返回的答案也应该有所区别。因此,用户意图分析和交互式问答系统成为当前信息处理领域的研究热点。本文研究基于用户意图分析的交互式问答系统。具体的研究内容包括:  第一、基于言语行为的用户意图分析。通过对真实环境中收集的交互式问答语料分析发现,相当比例的用户输入是有关系统功能的咨询、对系统回答的反馈等衔接性的对话。为保证信息交互的流畅性和系统接口的人性化,有必要对用户输入的意图进行识别,从而给出合理应答。本文根据言语行为将用户输入的意图分为以信息检索为目的的问句、功能咨询、对系统的正、负面反馈等6个类别,并结合多层次的语言学特征,使用机器学习方法进行自动分类。对不同意图类型的输入,制定不同的应答策略,提高了系统处理用户输入的覆盖面和泛化性。  第二、后续问句中的上下文相关现象处理。用户的连续问答中往往会出现指代、省略等基于上下文信息的信息缺省现象。建立上下文语境模型,对问句缺省的信息进行补全是交互式问答的基础。本文收集了真实环境的中文交互式问答语料,并着重在对话结构、话题过渡的方式、上下文相关现象以及它们之间的关系等方面进行了统计分析。在此基础上,本文将上下文相关现象的识别转化为层次化多标记的分类问题,为不同的信息缺省现象构建了统一的框架。该框架以问句信息角色作为候选缺省信息的语义单位,在传统的指代消解和省略识别特征的基础上,针对问句的特点,增加信息角色及其转移方式、问句类型等新特征。实验验证表明,该算法的通用性更强,识别和处理上下文相关现象的性能优于其他算法。  第三、基于认知模型的用户意图分析。对用户检索意图的分析和理解是信息系统的关键,它通过检索关键词或者问句中所表达的信息需求而体现。问句类型表示信息需求的类型,现有的工作通常将一个问句识别为一个确定的类型,但是由于用户意图的差异,对同一个问句,不同的用户想表达的信息需求往往也不同。为了对用户信息需求的差异性进行建模,本文基于用户问答的认知过程,提出一个具有三个维度的问句分类体系,这三个维度分别对用户的浅层信息需求、隐含信息需求和对答案在语用层次的期望进行建模。本文首先收集并详细分析了用户对真实问句在三个维度上的标注结果,进而通过提取领域无关的、多层次的语言学特征,使用机器学习算法为每个层次构建了自动分类模型。实验证明,70%左右的隐含信息需求和语用期望可以被正确识别。  第四、基于用户意图多样化的交互式问答。鉴于对同一个问句,具有不同检索意图的用户想表达的信息需求也可能不同。目前,返回结果的意图多样化研究已经在信息检索领域受到广泛关注,但在问答领域却还没有相关的工作。本文首先提出信息需求紧凑度的概念来度量问句是否具有多样化的信息需求。然后,从问句类型,即信息需求的类型和问句话题,即用户提问围绕的对象两方面进行多样化信息需求的挖掘。在此基础上,课题改进了传统的问句检索算法,根据信息需求的多样性和重要度对检索结果重新排序。本文从在线社区问答平台上收集海量真实问句,构建问句检索系统做为实验平台。实验验证表明,该算法可以有效提高答案集合满足用户意图的多样性和覆盖度。该算法进而通过图形交互的形式应用于交互式问答系统中。
其他文献
手机短信依靠移动性强、收发便捷、资费低等优势,已逐渐成为人们重要的沟通工具。手机用户数量的不断增加推着短信发送数量呈几何级数上升。垃圾短信的问题也因此突显出来,不
近几年来,随着“云计算”的普及,用户隐私和敏感数据的安全保护成为了各界关注的焦点。当前“云计算”服务提供商都是将用户存储地密文数据解密之后才进行处理,而这一过程将会使
安全是铁路运输永恒的主题,影响列车运行安全最重要的因素之一是轨道状态。而轨道几何不平顺是轨道结构部件综合性能的表现,直接反映了轨道状态的优劣。为了提高铁路运输的安
随着经济社会的快速发展,人们对信息化、智能化的需求日益增加,传统人工监视的方法已经很难满足监控要求,因此智能监控技术应运而生。智能监控是在无人为管理的情况下,利用计算机
自1969年互联网诞生到2011年互联网被广泛应用到社会的各个领域,流经互联网的数据量至少膨胀了200亿倍,并且这些数据每天都会以更快、更大规模的趋势增加。为了将每天产生的
互联网的蓬勃发展,引领了社会信息化的新潮流,创造了人类社会交流的新空间,给人类的生产生活带来了巨大的影响与改变。然而,当今社会仍然有相当一部分特殊人群,如视力残疾、
对于无线传感器网络来说,其研究的重要技术之一就是获取网络节点的位置信息。随着该网络应用的普及,对其的研究也逐渐从静态网络转向动态网络。动态的传感器网络定位技术成为
基于Web的地理信息系统已经成为一种大众化的信息工具,它是地理信息系统与因特网技术的有机结合。现有的很多基于Web的地理信息系统使用的都是栅格数据,在放大级别和复杂查询上
近几年来,随着多媒体处理技术的日趋成熟以及人们安全意识的不断提高,视频监控系统在社会生活的各个方面都得到了广泛的应用。人是社会的主体,监控系统的作用主要是实现对人
图像配准是将不同传感器在不同时间或不同成像条件下对同一景物获得的两幅或多幅图像在空间上对准,是图像处理的基本问题之一。配准效果将对图像拼接、图像识别、目标跟踪等后