论文部分内容阅读
在人工智能兴起的浪潮中,模拟人类交流能力的智能对话系统因其广泛的应用场景一直受到工业界的重点关注,同时也是国内外研究学者的热门研究方向之一。在对话系统类别中,任务导向型对话系统能够通过多轮对话的形式收集用户需求信息,提供符合用户描述要求的服务。普遍面向垂直领域的任务型对话系统在为人们生活提供更高效更优质服务的同时,也为企业节省大量人力成本,具有巨大的商业应用价值。基于管道方式开发实现的任务型对话系统通常由三个关键模块(自然语言理解模块、对话管理模块、自然语言生成模块)和一个后端数据库组成。自然语言理解模块对用户语义解析的准确程度直接限制系统的性能,因此,本文面向解决垂直领域任务的对话系统,重点对于其中自然语言理解部分展开研究。自然语言理解可以拆分成两个子任务:意图识别和语义槽填充,尽管国内外关于这两个任务已经展开了大量研究工作,但较少工作关注于系统的多轮交互特性,并且尚未有效整合领域知识来提升语言解析效果。本文针对上述问题,基于深度学习模型,开展了结合语境的意图识别方法和融合领域知识的槽填充方法研究。针对多轮对话数据的时序性,提出基于上下文信息的意图识别模型。对于单一对话中的多种意图采取多标签分类方法进行识别,分别在当前对话和历史对话层级对语义信息建模,发挥卷积神经网络和双向循环神经网络的互补优势。在微软发布的领域任务型对话数据上进行测试,实验结果表明,相较于基准算法,所提出的模型在意图识别任务上的准确性有明显提升。针对系统面向垂直领域的特性,提出基于领域知识的语义槽标注模型。嵌入层整合领域知识和用户意图,使用注意力机制让模型自主学习相关信息对当前任务的贡献程度,采用条件随机场优化语义槽序列标注结果。和基准序列标注方案进行对比实验,实验结果证明融合领域知识和用户意图能够提升槽位标识准确性,同时模型具备捕捉有效信息的能力。综合本文研究工作,将所提出的模型应用于电影票预订业务场景,设计并搭建基于领域知识图谱的电影票预订任务对话系统。构建电影领域知识图谱作为系统数据支撑,对话管理使用策略驱动,自然语言回复选用模板生成,实现系统内完整的数据传递流程。