基于深度学习的端到端对话管理技术研究与应用

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:cashcumt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人机对话在车载导航、智能家电以及机器客服等领域有巨大的需求,吸引了众多学者的关注。人机对话系统大致分为三类:智能问答、开放领域聊天和任务型对话系统。任务型对话系统旨在通过多轮交互,帮助用户完成具体任务,如餐馆预订和机票预订等。任务型对话系统主要包含自然语言理解、对话管理和自然语言生成等部分,其中,对话管理不仅要维护对话状态(即对话状态追踪),还要进行动作决策(即对话策略),具有关键作用。传统上,任务型对话系统各部分分别建模,近年来,将自然语言理解和对话管理以端到端的方式整体建模,以消除传统方法存在的误差累积问题。整体建模的研究已取得了不少成果,但还存在一些问题亟待解决。例如,仅有少量的工作聚焦于状态追踪的领域自适应问题;目前端到端对话管理的研究主要针对有限本体空间的情况,而真实对话任务中,经常会包含一些无限取值的槽;对话策略常采用强化学习进行训练,但是强化学习中存在的回报稀疏问题导致其收敛缓慢;强化学习所需的用户模拟器需要精心设计,费时费力。本文针对上述问题开展了一系列的研究,具体的工作内容及创新点概括如下:提出了一种基于阅读理解技术的领域自适应对话状态追踪模型,其中以槽描述为问题、对话内容为文本、槽值为答案,以端到端的方式来解决对话状态追踪的领域自适应问题。针对无限取值槽,模型通过对用户表述进行序列标注,找出槽值的位置以更新对话状态;针对有限取值槽,模型通过推断候选槽值是否隐含于对话中来更新对话状态。在SGD数据集上的实验表明,所提出的对话状态追踪模型具有领域自适应能力。提出了一种基于层级循环神经网络的对话管理模型,该模型以端到端的方式将自然语言理解与对话管理作为整体进行建模。模型底层循环神经网络进行序列标注以获取值槽;上层循环神经网络综合句子表示、历史对话状态和历史系统动作,更新当前时刻的隐式对话状态;最后,隐式状态表示通过多层感知机映射到动作空间。模型可以在获得对话决策动作的同时获得槽值。相比于已有研究,该模型能够用于槽值空间无限的对话任务;槽值的标注数据可以由用户模拟器通过词汇化模板提供,比状态追踪的标注数据更易于获取。提出了一种高回报优先经验回放算法。该算法在每次训练之前,先模拟一定数量的对话,依据结束时刻的回报函数来判断对话成功与否。在模型训练时,优先采样成功的对话序列,同时为防止模型收敛于局部最优,还补充采样一些随机的对话序列,最后,将上述两部分对话序列混合,用于模型的训练。实验表明,在回报稀疏的对话任务上,相比于已有的经验回放算法,高回报优先经验回放算法能够有效地提高强化学习的收敛速度。将对话管理模型与用户模拟器之间的交互建模为多智能体强化学习,通过二者的合作训练,联合调整对话管理模型与用户模拟器之间的交互策略,极大简化了人工设计用户模拟器的过程。为所提出的多智能体对话模型定义了基于对话动作邻接对的回报函数,采用一个对话管理同时与多个用户模拟器合作的训练方式。实验表明,基于邻接对的回报函数不仅提高了模型的收敛速度,还能缓解对话管理与用户模拟器陷入非正常对话行为的问题,从而提高了对话管理的性能。基于上述对话管理模型,设计并实现了一个中文会议室预订系统。该系统通过自然语言与用户交流,来帮助用户完成会议室的预订。
其他文献
软件定义网络(software-defined networking,SDN)是一种新型的网络结构,与传统网络不同的是SDN分离了网络中的控制平面与数据平面,其中控制平面由逻辑集中的控制器组成,数据
当今社会正处于高速发展大数据时代,亟需开发和设计容错性更高、安全性更强、更加可靠的计算机系统。计算机系统的可靠性和容错性很大程度取决于其互联网络的性能。图作为互
图像去雾作为图像复原的重要组成部分,在自动驾驶领域具有重要意义,吸引了大量学者的关注和研究,相关的研究成果层出不穷。本文主要关注基于图像复原的单幅图去雾方法,此类方
功能梯度材料(Functional graded materials,FGMs)是一种材料组份或/和微观结构随空间位置连续变化的非均匀材料,其具有降低应力/温度集中、控制变形和抵抗接触损伤等能力。
出行在现代人的日常生活中扮演重要作用,通过研究人们运动轨迹中的时空特征可挖掘出用户的出行规律,尤其是对于车辆轨迹的研究可以获得车辆在多个特定时间段内的移动特点等,与移动对象相对应的网络属性标签结合可推断出作息规律、兴趣爱好、生活习惯,路线偏好等重要信息,对于理解移动对象的行为模式、提供高精准度的智能推荐等都具有很高的应用价值。针对移动轨迹频繁模式挖掘相关问题,本课题研究了移动轨迹的语义化处理,语义
作为物联网技术的重要应用,车联网(VANET)受到了深入的研究和广泛的关注。其中节点之间的安全认证更是成为VANET安全研究的热点之一。口令认证密钥交换协议(PAKE)因其良好地机密性、数据完整性和认证服务,成为车联网安全认证中一种可行的认证机制。但是,传统PAKE协议是基于两个或多个用户间安全预共享的短口令来生成高熵的会话密钥。而批量生产的设备其初始化密码往往保持低熵,即拥有相同或相似的初始化设
众包是人类计算的一种表现形式,它通过汇集和运用网络群体中个体的知识与智慧来解决计算机不擅长完成或无法独立完成的任务,目标是实现人类智能与机器智能的良好结合以获得更
背景多氯联苯(polychlorinated biphenyls,PCBs)是一类持久性有机污染物,在全球各地环境中持续存在并可经过食物链进行生物富集和生物放大。PCBs能够通过空气、食品、水体等
随着互联网技术的蓬勃发展以及手机、平板设备等移动设备的硬件的提升,通过拍摄文档采集到的图像在各个行业中都有着广泛的应用,但是在自然场景采集的图像质量参差不齐,直接影响了在后续场景中的使用。通过量化文档图像质量,根据图像质量的好坏来筛选图像,可以优化各种与图像处理相关的应用。文档图像质量评价系统是为了综合地评价文档图像质量,计算多个图像质量评分。通过分析文档图像的特点,本系统设计并实现了多个图像质量
人-机器人交互在机器人遥操作中具有非常重要的作用,是机器人领域的一大研究热点。随着科技的进步,人与机器人的交互方式不断朝着更加自然高效的方向发展。本文针对现有的人