基于PAD情感状态模型的对话生成研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:lliiuuffuuyyaann
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在开放域对话生成系统中,Seq2Seq模型取得了不错的效果。但是,由于Seq2Seq模型没有着重建模情感信息,因而该模型生成的回复语句往往在情感上与源语句不太匹配。为了在对话系统中引入外部情感信息进而引导其生成情感合适的回复语句,我们将基于PAD情感状态模型的PAD情感向量引入Seq2Seq模型并取得了比传统Seq2Seq模型更好的效果。“PAD情感状态模型”是用以描述和度量情感状态的一种心理学模型,它包含三个数值型维度:愉悦度、激活度和优势度,理论上可以利用这三个维度表示所有的情感状态。在本文中,首先,我们根据PAD情感向量词典赋予每一个词语一个三维的PAD情感向量,该向量代表了词语的情感信息,然后,将词语的PAD情感向量和词向量一起作为编码器的输入进行“联合编码”,这为Seq2Seq模型增加了额外的情感信息。其次,为了解码器能够在解码阶段有选择性地“关注”上下文的内容信息和情感信息进而生成情感合适的回复,本文提出“联合注意力机制”,包括“内容注意力机制”和“情感注意力机制”。“情感注意力机制”基于PAD情感向量,它可以在解码时有选择地“关注”并充分利用源语句中词语的PAD情感向量包含的情感信息,进而引导模型生成情感质量更高的回复。在心理学中,共情是一种至关重要的情绪引导机制,受此启发,为了引导模型产生“共情式”回复,我们扩展了“交叉熵损失”,提出基于PAD情感向量的“情感交叉熵损失”替代“交叉熵损失”作为Seq2Seq模型的损失函数。我们通过自动评价和人工评价对模型的效果进行了对比和分析。实验结果表明,相比于传统Seq2Seq模型,我们提出的基于PAD情感向量的Seq2Seq模型可以产生质量更高的回复。综合Perplexity评价指标和人工评价,S2S+W2AV+JAtt+Aff-XENT模型是我们提出的所有模型中表现最好的模型;相比于基准模型(Seq2Seq模型),该模型能够产生在情感上更为合适且语言更为流畅的回复,这证明了我们提出的“基于双向LSTM的联合编码”、“基于PAD情感向量的情感注意力机制”以及“情感交叉熵损失”的有效性。
其他文献
在调研国外含水层储气库建设和咨询专家的基础上,对含水层构造改建地下储气库的影响要素进行详细归类和分析,从选址技术、地质安全、社会环境以及经济性4个角度出发,选取23个
舆论战是每一个国家、每一支军队都需要的重要作战手段。舆论战也是宣传战。只有制定适当的宣传口径,对受众精确定位,对宣传内容精细加工,对宣传媒介合理选择,对宣传效果进行
采用电化学充氢技术、动电位扫描技术、交流阻抗技术(EIS)和慢应变速率拉伸试验(SSRT)研究库尔勒土壤模拟溶液中氢对X80管线钢应力腐蚀开裂(SCC)行为的影响,并利用扫描电镜(S
9月30日,“东方基因·传承与创新”闭幕秀在柯桥中纺CBD·东方米兰国际时尚发布中心举行,至此历时5天的2019柯桥时尚周(秋季)也圆满收官。自2015年至今,柯桥时尚周已
所谓"核心"是人体的中间环节,就是肩关节以下、髋关节以上包括骨盆在内的区域,是由腰、骨盆、髋关节形成的一个整体,包含29块肌肉。核心肌肉群担负着稳定重心、传导力量等作
分析传统家校通的不足,提出了基于微信公众号的家校通设计理念,进行了概要设计和系统设计,并用开发工具实现了微信公众号和家校通的各种功能,本系统具有消费低、系统化、即时
本文介绍了动态规划法的原理及其公式的推导,着重说明在桥梁纵向弯矩(M)、剪力(Q)、轴力(N)三条影响线上加载时,若在对其中一条形成极值函数的同时也形成其它两条相应的影响
大力发展文化产业已成为各国竞相追逐的一股潮流。在这种形势之下,中国也应参与这种全球化趋势,坚持文化立国的方针,充分挖掘本国文化资源优势。海派文化作为我国的一种富贵
组合梁与钢梁的侧扭失稳机理与形态存在显著差异,与纯钢梁的失稳相比,组合梁中钢梁上翼缘受到刚度较大的混凝土板约束,表现为与纯钢梁不同的畸变失稳。采用钢构件的Perry-Rob
知识分子的角色伴随着时代变迁和文化差异而具有动态性。在社会转型期,尤其是媒体彰显出强大影响力的背景下,知识分子的话语表达借助媒体平台已经成为一种取向。德布雷和布尔