论文部分内容阅读
随着人工智能技术的发展,人机对话系统逐渐出现在了人们的日常生活中。这种任务驱动的人机对话系统能够通过用户提供的信息,协助用户完成特定领域的任务。口语理解作为任务型人机对话系统的关键模块,可以从用户的自然语言中提取出计算机能够识别的结构化数据,主要包括两个子任务:用户语句的意图识别与语义槽填充。深度学习模型能够以端到端的形式高效地完成口语理解任务,从而提高任务型对话系统的整体效果。在多轮对话中,用户与机器之间的历史对话信息能够为口语理解模型提供额外的信息支撑从而更好地理解用户的当前语句。但是并非所有的历史信息都与当前句相关,在人机交互中用户的意图存在跳转的情况,这时无关的历史信息则会为当前句的理解带来负面影响。此外,在人与人之间的交互中,言语背后通常都省略了人们通晓的常识和知识,但是机器却不了解这些信息,无法和人类一样进行推理。本文将历史信息和外部知识引入意图识别和语义槽填充的联合模型,使模型能够更加精准地理解用户对话。本文主要研究包括:提出了一种融入历史信息的口语理解联合模型,该模型能够利用机器与用户之间的历史对话信息,从而提升意图识别和语义槽填充任务的准确度。针对该历史信息存在的意图跳转问题,本文提出了一种注意力机制,用于对历史对话信息分配相应权重,获得更相关、更有效的历史向量表示,并用加权平均的方式得到每个“词”对应的历史信息向量表示,最后将其融入联合模型;同时,利用口语理解中意图识别任务与语义槽填充任务的强关系,设计了一种辅助门结构,该门结构能够利用意图识别的结果限制槽位生成。实验结果表明,本文提出的口语理解模型可以更准确的识别用户意图和语义槽信息。提出了一种融入外部知识的口语理解联合模型,该模型在加入了历史信息作为辅助的同时,引入了外部知识库作为知识和常识的补充。如何从知识库中找到当前最需要的候选知识集合,以及如何对该知识集合进行筛选是目前面临的主要挑战。针对候选知识的筛选问题,提出了一种基于“词”的注意力机制,以“词”为查询信息,利用注意力机制对其进行加权平均,得到候选知识向量,用于下游联合模型。实验结果表明,加入了外部知识的口语理解模型能够在用户意图识别和语义槽生成任务上取得更优的效果。