论文部分内容阅读
人机对话系统具有方便、快捷、高效等众多优点,被视为未来重要的人机交互形式之一,其发展得到了学术界和工业界的高度重视。作为对话系统重要组成部分的对话生成,它的目标是根据用户的对话消息生成回复,其质量的好坏直接影响着用户的使用体验。随着深度学习技术的不断进步,为对话生成研究的发展提供了新动力。然而在面向开放领域的对话生成研究中,基础对话生成模型存在倾向于生成如“不知道”等一类缺乏内容回复和生成的回复趣味性与可持续性低的问题。语言的表达需要情感与内容的支撑,情感与内容可以使语言更加生动自然、充实、富有感染力。在对话生成中考虑上下文中的情感和内容,不但可以为对话提供情感的润色和内容上的填充,缓解系统易于生成缺乏内容回复的问题,同时提升回复的情感与内容的多样性,可以增加对话的趣味性、可持续性。本文将研究基于情感与内容特征的对话生成,即在对话生成的过程中,根据用户消息中所蕴含情感与内容特征,采用心理学“情感共情”机制和情感与内容特征在真实对话中的转换关系,引导深度学习模型生成满足用户情感需求且内容相关的回复。本文主要研究工作如下:(1)提出融合情感与内容特征的对话生成模型(CECF-DG)。为了获取用户消息中所蕴含的情感与内容特征,该模型采用深度学习技术构建特征识别器,获取用户消息中潜在的情感与关键内容特征。为了促进情感与内容的融合,该模型构建了基于注意力机制的情感与内容特征解码器。在解码器中为每种特征设计独立的特征解码单元,学习不同特征的表达。在解码过程中,利用注意力机制,动态获取用户对话消息编码,促进不同类型特征的融合。通过设计对比实验,结果表明,模型在自动评测与人工评测的各项指标上均获得了一定的提升。(2)提出一种基于情感与内容特征转换的对话生成模型(ECFC-DG)。在真实对话消息中,用户不仅仅需要具有一致性情感与内容的回复,还需要情感与内容更为多样的回复,来提升对话的趣味性和可持续性。考虑到情感与内容在真实消息与回复之间存在着一定的关联性,这种关联性具有提升情感与内容多样性的作用。基于此,该模型以Seq2seq模型为基础,通过引入特征转换矩阵和学习函数来学习情感与内容特征在源语句与目标语句之间存在的转换关系,然后将转换后的情感与内容特征融入到模型解码过程中,最终生成回复。实验结果表明,模型生成的回复在情感和内容的多样性的各项评价指标中均有提升。