论文部分内容阅读
人机对话生成是自然语言处理领域中十分重要的研究方向。如何生成高质量、多样的、流畅通顺、带有情感的对话是一项十分具有挑战性的任务。随着人工智能和深度学习技术的飞速发展,端到端的神经网络模型提供了可扩展的对话生成框架,为机器从语义上进行理解并自动产生回复提供了可能性。神经网络模型也带来了新的问题与挑战,基本的对话模型框架往往倾向于产生普适性、无意义、相对“安全”的回答。本文基于生成对抗网络在情感对话生成任务上进行了相关的探索和研究。本文的主要工作如下:(1)基本的对话生成模型往往不能很好的从对话文本中挖掘出句子的情感特征。为了构建能够生成指定情感的对话生成模型,将情感对话生成任务进行了拆分,训练了多个不同的模型来生成不同情感的对话文本,每个模型专注于生成一种情感的对话文本,这样使得对话生成模型在生成指定情感对话的过程中排除了其他情感所产生的干扰与影响,从而提高了模型生成某类别情感对话文本的准确度。(2)基于对抗生成网络提出了新的情感对话生成框架SMC-GAN来完成情感对话生成任务。所提出的情感对话生成模型包括一个生成模型和多个判别模型。生成模型是基于基本的Seq2Seq(sequence to sequence,序列到序列)对话生成模型所构建的,判别模型包括基本判别模型、情感判别模型和流畅度判别模型。基本的判别模型可以区分生成模型生成的虚假对话文本(fake text)文本和来自数据集的真实对话文本(real text),情感判别模型能够区分生成句子的情感类别和某个指定的情感类别是否相同,指导生成模型生成指定情感类别的对话文本,流畅度判别模型能够对生成对话的流畅度进行评分,指导生成模型生成更加流畅通顺的句子。通过实验对比证明,所提出的SMC-GAN模型能够生成一致的、带有指定情感的、流畅通顺的对话文本,与基线模型相比,所提出的模型在情感准确度,一致性,流畅度上都表现出了更好的效果。