论文部分内容阅读
在互联网和人工智能技术快速发展的时代,对话系统以其自然友好的交互方式,促进了人和信息的连接。而在开放领域下构建的聊天对话系统,更有着广阔的研究价值和应用前景。现有的闲聊对话系统基于神经网络技术构建,往往难以控制对话回复里的属性,如生成带有高兴情感的回复。目前还不够成熟的回复可控性大大限制了对话系统的进一步研究和应用推广。因此,可控的闲聊对话生成在对话系统研究中有着重要的意义。闲聊对话系统主要基于神经网络的编码器-解码器结构,在大规模语料上以端到端的方式训练。这样的模型往往难以控制回复的特定属性,如情感,句式。具体的,情感对话控制生成是根据给定的对话输入和目标情感类别,生成符合该情感的回复;而回复句式一般分为疑问句、感叹句、陈述句和祈使句,控制句式的生成可以达到不同的回复语气和目的。因此,本文从具有代表性的情感和句式这两个可控闲聊对话生成任务为研究切入点,探索实验了如何建模输入消息和控制条件,并做出了以下工作内容和研究成果:(1)作为情感对话场景下的情感词向量,设计了基于多任务学习的情感词向量训练模型。模型结合了语言模型和情感分类任务,通过预训练-微调的方式有效的融合了语义和情感在词向量中的表示。本文提出的情感词向量可以更好地权衡语义表示和情感表示:普通词汇侧重于嵌入语义信息,而带有感情色彩的词语则包含了细粒度的情感信息。实验对比了未考虑情感信息的传统词向量,结果显示提出的情感词向量可以有效嵌入情感和语义信息,并促进情感对话的控制生成效果。(2)对于情感对话的控制生成,设计了基于内容和情感解耦表示的条件变分自动编码器模型。本文在表示学习和控制条件建模的基础上,解耦了对话的情感和内容隐变量的状态表示,并利用一种新的对偶解码器融合情感和内容信息生成回复。实验证明提出的模型可以在保持了对话生成多样性的同时,提高了目标情感在回复上的控制生成能力。(3)对于句式在对话中的的控制生成,设计了一种全局控制信号引导的层级生成模型。具体地说,解码器分为管理员和工作者模块。该模型利用条件变分自动编码器的隐变量和句式分类器抽取的特征作为全局控制信号,在管理员模块中制定阶段控制目标,引导工作者模块完成回复的控制生成。相比过去的工作,本文提出的模型不需要依赖人工整理的词汇表,训练更加端到端,同时增强了对内容和结构的控制表达能力。通过对情感对话生成和句式控制生成进行研究,本文较全面地对单轮闲聊对话的控制生成做了理论和实验上的探索和验证,对后续的对话系统研究具有重要参考意义。