融合情感识别的对话生成方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:timhero
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能和自然语言处理技术的发展,闲聊型对话系统的研究发展迅速。其中生成相关的对话内容是该任务的基本目标,而恰当的情感交互可以使系统更加智能。因此,情感对话生成,即生成蕴含情感的合理回复,成为了对话系统研究的热点和难点。当前情感对话生成研究通常根据对话内容和给定的情感标签,预测并生成包含情感的对话。该研究的前提需要给定历史对话的情感标签,然而在现实场景中难以直接获取这类情感标签。针对这一问题,本文将情感识别模型融入情感对话生成任务中,并完成后续的迁移学习研究。主要研究工作如下:本文提出了融合情感识别的对话生成方法,融合了情感识别模型与对话生成模型。具体来说,首先采用情感识别模型识别历史对话的情感信息,然后将得到的历史情感标签作为异质图结构中的一类结点,得到结合历史话语和情感信息的图编码表征,最后经过解码器生成蕴含合适情感的回复序列,解决了模型在真实场景中无法自动获取情感标签的问题。针对融合方法,我们将两个模型的词向量编码层与句子级特征提取层分别合并,建立了基于隐层共享的联合训练融合机制。通过对比实验,证明联合训练机制比独立训练效果更优,与基线模型相比,该方法在当前情感预测的准确率和对话内容的生成质量上具有明显的优势,适用于各类真实场景中的对话生成任务。进一步,本文提出了基于迁移学习的角色对话生成方法。为了使情感对话生成模型具备独特的角色性格,我们建立了针对角色性格的编码层,并在异质图结构中增加了角色结点,同时将当角色性格融入解码阶段,生成与当前角色相符的情感回复。由于包含角色标注的数据集规模较小,我们首先在数据规模较大的源域数据集上进行预训练,再将共享参数和模型结构迁移到包含角色标注的目标域数据集进行微调训练。经实验证明,该迁移学习方法提升了模型在小规模的角色标注数据集上的对话生成效果,与基线模型相比,该方法在困惑度和多样性指标上的效果大幅提升。经过超参实验分析,证明将角色标签映射到高维角色性格层明显提高了模型对当前情感预测的准确性。
其他文献
Z银行潍坊分行成立于2010年,经过十几年的发展,在潍坊当地市场建立起良好的口碑,Z银行潍坊分行国际业务近年来发展势头迅猛,特别是在2020年和2021年经历高速增长后,在可预见的2022年将面临市场份额及中间业务收入的急剧下滑,亟待找出原因并提供解决方案。本文将从营销的角度对Z银行潍坊分行国际业务的经营现状进行分析,同时结合其所处市场的内外部环境和行业竞争环境进行银行自身SWOT分析,进而制定国
学位
初中生物学科是一门注重探究和实践的学科,具有生命性、基础性、思想性和实验性的特点。从学习内容上来看,它主要涉及关于生命现象和生命活动规律的相关内容,部分内容理论性强、较为抽象,学生学习起来有一定难度。从学科核心素养培养的角度来看,新课改下的初中生物教学以培养学生的生物学科核心素养为目标,这需要进一步优化初中生物教学方法。基于此,文章阐述了实验教学在初中生物教学中的重要性,分析了当前初中生物实验教学
期刊
<正>各地中考一般均按照7∶2∶1的难度要求来进行命题,即题目中简单题和变式题要占到总题目的 90%,可以说试卷的整体难度不大。为了增加试题的区分度,很多看似简单,甚至答案呼之欲出的题目往往“暗藏玄机”,稍不留意就会丢分。很多同学往往在原本难度不大的问题面前功亏一篑,甚至明明已经领会了题意最后还是答错。在中考中如何避免这些失误达到做题准确呢?让我们一起审视并试着分析审题失误的原因,找到解决方法。
期刊
在中考中,物理是一门必考科目,题型主要分为选择题、填空题、实验题和计算题等题型.教师在教学时,要对中考物理的解题方法和解题技巧足够重视,以物理解题为切入点和落脚点,对学生进行积极引导,使学生掌握物理的一些解题方法和解题技巧,并且在掌握方法的基础上,培养良好的解题习惯,以此来帮助学生在中考物理中取得理想的成绩.
期刊
内蒙古自治区是我国北方重要的生态安全屏障,主要属于干旱半干旱性气候区,区域跨度大,地域分异显著,生态系统本底脆弱。在全球气温上升和人为因素的双重影响下,生态环境愈发脆弱,其中湖泊作为地表水圈的重要组成部分,也受到了破坏。水体颜色是反映湖库水质综合状态的一个重要指标,但目前针对内蒙古湖泊水体颜色的大尺度时空研究尚有欠缺。本文以呼伦湖、达里湖、岱海、红碱淖和乌梁素海5个内蒙古典型湖泊为研究对象,基于L
学位
《国际财务报告准则第9号—金融工具》于2014年7月正式发布。2017年4月,我国《企业会计准则第22号—金融工具确认和计量》(以下简称“新准则”)也随即颁布。根据新准则要求,只在境外或同时在境内外上市的企业需要于2018年1月1日起实施新标准,只在境内上市的企业需要于2019年1月1日开始执行新标准,其他非上市企业可于2021年1月1日起执行新标准。在计量信用风险的减值时新准则要求企业需前瞻性地
学位
为全面、准确、高效地获取秸秆露天焚烧碳排放量,基于中分辨率遥感数据,估算了呼和浩特市地区秸秆露天焚烧碳排放量。利用Landsat OLI卫星监测到的高温异常点数据提取了2014-2020年呼和浩特地区秸秆露天焚烧火点,得到了呼和浩特地区7年的秸秆露天焚烧火点数量和分布变化。基于2020年Sentinel-2遥感数据,计算了研究区主要月份的归一化燃烧指数(NBR)和燃烧面积指数(BAI),并提出改进
学位
<正>摘要 目的 探讨黑质纹状体系统的磁化率值 (MSV)和影像组学特征结合能否作为诊断帕金森病(PD)及其相关认知功能障碍(CI)的影像学指标。方法 共 104 例 PD 病人和
期刊
期刊
内陆水体对水循环、能量循环与生态系统都有着重要的意义,同时水体的扩张与萎缩也是指示环境变化的重要指标。内蒙古自治区位于典型干旱半干旱气候区,该地区降水少,降水分布不均,因此内蒙古的水体相对来说更加敏感脆弱,过去一段时间的气候异动与人类日益增强的生产性活动对水体环境造成了巨大威胁。本文以内蒙古自治区的开阔水体为研究对象,基于谷歌地球引擎,提取了1990-2020年内蒙古全区永久性水体的空间分布数据;
学位