基于状态管理与情感原因发现的同理心对话生成研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ashwgs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,微软小冰、天猫精灵等聊天机器人的研究与运用得到快速发展,并开始扮演着重要的角色。除了进行正常的自然语言理解与生成外,拥有情感理解与同理心对话能力是聊天机器人的重要特征。合理有效的同理心回复可以带来更好的用户体验。现有的同理心对话方法主要采用多任务学习框架,在情感分类的同时进行回复生成,取得了不错的效果,但仍存在一些问题。一方面现有方法通常只利用了部分情感信息,却忽视了其他与对话相关的状态信息;另一方面现有方法大多只利用了浅层的情感类别信息,但缺乏对深层的情感原因信息的利用。针对这些问题,本文分别从状态管理和情感原因发现两个角度对同理心对话生成方法进行研究,主要内容包括:对同理心数据进行观察和分析发现,对话轮次之间存在不同的状态转移规律,即同理心回复受到多个状态影响,不同的状态特征对于回复的生成有很大影响。因此,本文首先研究基于状态管理的同理心对话生成模型。该模型由基于Transformer的状态管理模块以及回复生成模块组成。状态管理模块利用两种状态转移的先验矩阵和对话历史信息进行状态预测,回复生成模块则将状态管理模块所预测的状态特征采用两种方式融合,并利用门控机制输出最终的回复输出。在Empathetic Dialogues同理心对话数据集上的实验结果表明该方法在BERTscore等自动评估指标以及人工评估指标上均优于基线模型,可以有效利用状态信息生成更合理的同理心回复。针对现有同理心对话对情感理解利用不足的问题,本文进一步挖掘对话中的情感原因,提出了基于情感原因发现的同理心对话生成模型。该模型包含情感推理模块和回复生成两个模块,前者同时进行情感分类和情感原因检测。后者由seq2seq框架组成,通过软门控注意力机制或者硬门控注意力机制两种方式在交互注意力层上引入情感原因信息,并进行最终的回复输出。在Empathetic Dialogues数据集上的实验表明该方法相比于当前最好的模型在情感预测准确率上提升7.37%。在其他自动评估指标和人工评估指标上也取得目前已知的最好效果,表明该方法的有效性。
其他文献
目的本研究探讨孕妇睡眠模式、妊娠期心血管健康(cardiovascular health,CVH)和子代出生体重三者之间的关系,验证妊娠期健康的睡眠模式是否能够改善较差的CVH状况导致的子代不良出生体重,为科学指导妊娠期睡眠,促进母婴健康提供科学依据。方法本研究基于合肥市母婴健康队列,从合肥市三家医院招募了9 013名定期产检的孕妇,自基线(16-23周)随访至分娩。在基线时通过问卷调查收集孕妇的
学位
目的描述大学生睡眠时型和抑郁症状的流行状况,分析睡眠时型与抑郁症状的关联强度。采用生物学指标暗光褪黑素初始释放时间(dim light melatonin onset,DLMO)验证大学生睡眠时型与抑郁症状的关联效应,并从表观遗传学角度进一步探讨生物钟基因DNA甲基化在睡眠时型与抑郁症状纵向关联中的调节效应。方法2019年4—5月,采用整群随机抽样方法在安徽省合肥市某医科大学2个专业和江西省上饶市
学位
金融要素抽取,旨在应用信息抽取技术,从合同、计划书中提取出能够反映金融文档关键性信息的实体和短语等要素,实现对金融文档的结构化处理。与现有抽取任务相比,金融要素抽取任务存在长尾分布、细粒度、长文本长要素以及上下文受限等复杂问题,现有模型在此类复杂环境下的抽取效果不佳,无法完全满足任务需求。因此,探索具备复杂场景抽取能力并能解决实际应用需求的金融要素抽取模型,是一项具有学术与应用价值的研究。针对长文
学位
气旋气象作为极端的灾害性气象现象,能够在短时间内造成剧烈的气候变化,最典型的例子是极地涡旋气象与台风气旋气象。气旋气象的发生会对人类生产生活造成巨大的影响,甚至会影响整个大气系统的正常运转。随着卫星遥感技术的快速发展,使用卫星遥感监测数据对气旋气象进行监测识别与分析,及时采取防护措施,是降低该类灾害性气象影响的重要方式。目前基于卫星遥感图像的气旋监测研究方法普遍存在监测精度较低和算法鲁棒性不足等问
学位
目的基于医学生童年期不良经历(Adverse childhood experiences,ACEs)暴露类型和时相探索ACEs暴露模式,分析ACEs暴露模式与医学生抑郁、焦虑症状发展轨迹的关联。方法以安徽省两所医学专科学校大一学生为调查对象,2019年11月-12月进行基线调查,之后每半年进行一次随访,共随访两次,收集有效问卷3662份。使用儿童期虐待问卷、家庭功能不全问卷、WHO社区暴力与同伴欺
学位
目的依托出生队列,分析孕早期妊娠相关焦虑(pregnancy-related anxiety,PrA)对3~7岁儿童饮食行为的影响,并探讨3~7岁儿童近半年情绪和行为问题在其中的作用。方法2008年10月至2010年10月在安徽省马鞍山市妇幼保健院招募孕早期建档并同意加入中国安徽出生队列的孕妇,随访至子代学龄前期。采用自编《孕产期母婴健康记录表一》在孕早期收集孕妇及其丈夫人口学特征和孕期等相关信息
学位
目的评估亲子分离经历对学龄前儿童情绪与认知发育影响的敏感期和累积效应,探索端粒长度在亲子分离经历与学龄前儿童情绪与认知发育关联中的作用,为预防早期亲子分离带来的健康危害提供理论指导和干预框架。方法于2021年5月采用整群抽样方法招募芜湖市南陵县9所幼儿园2729名学龄前儿童,其中2447名儿童(1266名男童,占比51.7%)有完整问卷信息,平均年龄为(4.88±0.96)岁。采用父母问卷(电子问
学位
目的探讨母体孕早、中、晚期及脐血血清中7种炎症因子浓度与学龄前儿童智力发育水平之间的关联,揭示关联的敏感期及其性别差异,为预防儿童智力发育损伤和发育起源性疾病的发生提供理论依据。方法本研究依托马鞍山优生优育队列(MABC),最终纳入1 641对母子对进行分析。在母亲孕早、中及晚期产检时采集空腹外周静脉血,并在分娩时采集脐血,使用Luminex液相悬浮蛋白技术检测样本血清中7种炎症因子浓度,包括干扰
学位
购物小票票据是线下消费过程由商户提供给消费者留存的购物凭证。由于线下零售销售系统的独立性,海量线下消费数据被不同品牌、商铺形成的“信息孤岛”所隔离。在此背景下,对购物小票票据进行数字化信息结构抽取可以为智能零售提供针对商品运营和供应链优化的精准数据分析。传统光学字符识别(Optical Character Recognition,OCR)系统在扫描文档图像的文本检测和识别任务上表现优秀。但是,由于
学位
中长期的天气预报主要是指两小时以上的天气预报,其在灾害预警、降水估计、农业灌溉和交通规划等领域都有着重要的应用价值。而中长期的天气预报主要依赖于卫星云图预测任务,它是时空序列预测的一种应用场景。但由于卫星云图序列运动规律计算困难且预测时间长,该预测任务具有极大的困难与挑战。传统的光流法和交叉相关法都是建立在理想的条件下,对卫星云图的复杂运动系统难以预测。而近年来基于深度学习的时空序列预测算法在处理
学位