基于强化学习的情感对话回复生成算法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:ssddhwl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度学习算法的不断更新改进与计算机硬件设备计算能力的提高,聊天机器人的研究也取得了很大的进展和突破。生成式的聊天机器人因其良好的迁移性和泛化性,具有广阔的应用前景。本文主要研究开放域生成式聊天机器人,致力于将情感智能加入到对话中,提升对话生成质量的同时与用户建立情感羁绊,使对话内容更加流畅多样。本文的主要工作如下:一、针对开放域生成式对话中存在的安全回复以及缺乏情感因素的问题,本文提出一种基于强化学习的情感对话回复生成算法。首先根据情感数据分析得出对话中的多元情感迁移矩阵,利用多元情感分类模型将情感监督信息加入到对话语料中。结合强化学习算法,从内容质量和情感两个方面构建奖励函数,然后对其进行策略优化,使其选择未来收益最大的富有情感且内容流畅的回复句。实验表明,与基准方法相比,本文所提方法生成的情感对话回复内容,语句更加清晰流畅,情感更加充沛。二、针对公开的情感分类数据集较小而影响了后续情感对话生成效果的问题,本文提出了一种情感词向量分类与强化学习算法融合模型。首先提出一种多任务联合情感词向量模型,结合语言模型和情感分类模型,权衡语义表示和情感表示,将更细粒度的情感信息嵌入到词向量中去。然后将情感分类器和强化模型进行融合,并在解码阶段加入情感多样集束搜索算法,有效避免安全回复的同时增加对话回复中的情感色彩。实验表明,与基准方法相比,本文所提方法的泛化能力更强,生成回复的情感倾向更加明显。本文通过强化学习将情感融入到对话中,并结合实验对情感对话回复生成算法进行了探索与验证,所提模型生成的对话情感更加充沛,对后续的对话研究具有重要的参考价值。
其他文献
崩塌灾害作为我国常见地质灾害之一,长期以来严重威胁着人民的生命财产安全和日常经济活动。据自然资源部地质调查局资料显示,我国每年因各种原因引起的崩塌灾害近2 000起,灾害的发生往往伴随区域重大人员伤亡和经济损失,严重制约社会各项事业的发展。因此对崩塌灾害的预测研究及治理尤为重要,而崩塌敏感性分析是进行预测研究的基础,其首要任务就是对崩塌发生的可能性及影响范围进行评价分析,从而有效反映崩塌发育趋势,
非公有制经济作为我国公有制经济的补充,与公有制经济相辅相成、相得益彰。我国的中小企业在我国的非公有制经济中占有重要地位。然而,由于中小企业资产规模较小,盈利较不稳定,缺乏增信措施,难以获得传统商业银行的青睐。从2008年以来,我国影子银行规模扩张非常显著,因其新颖的产品设计、便捷的流程,丰富了中小企业的融资方式,在中小企业融资市场上有着独特的地位。本文由此切入,主要讨论影子银行的规模扩大对中小企业
近年来,随着经济水平的逐渐提高,我国的社会保障制度逐渐发展,社会保险体系日益完善,企业职工养老保险参保人数和参保企业数量逐年递增,养老保险经办机构相关工作量越来越大,工作难度也越来越高。哈尔滨养老保险经办机构是哈尔滨政府服务机构中的重要组成部分,承担着养老保险的经办服务工作,是政府形象和公共信用能力的重要体现之一。养老保险经办机构经办服务能力一方面关系到群众的切身参保权益,另一方面关系到政府职能部
姿态测量技术在车辆的运动信息量测和智能控制方面有着十分广泛的应用。利用多天线导航卫星进行载体的姿态测量是近年来逐渐兴起的技术,但其更新频率低、环境适应性较差、精度受基线长度影响、实时性较差,这些特点极大的限制了该技术在车辆姿态测量和姿态控制方向的应用。本文重点研究如何提升导航卫星测姿系统的数据更新率、提升系统的精度、改善系统的环境适应性,旨在研制出一种低成本、精度高的辅助测姿装置以满足导航卫星测姿
为适应经济全球化,我国自2001年加入世界贸易组织后逐步开始放开严格分业经营制度,迈入混业经营制度。随着我国混业经营程度的不断增加,证券、银行、保险与信托四个行业间的风险协同性也呈现增长趋势,为出现大规模金融系统性风险埋下隐患,对我国金融监管产生巨大挑战。为研究金融系统内部风险传导机制,本文选择证券、银行、保险及信托四个金融业主要子行业作为研究对象,选择申万二级行业指数与中信行业指数2010年10
糙率系数是体现河床边界对水流运动产生阻碍的一个十分重要且敏感的综合性参数。在明渠的水力计算中,糙率系数的相关研究,是明渠水力计算向精准方向发展进程中亟待攻克的关键
近年来,随着经济的快速增长,中国电力已经进入一个快速发展时期,而随着电力体制改革的逐步深入,传统的电力企业管理模式已经不能适应当前竞争市场的发展要求。伴随着2015年《关于进一步深化电力体制改革的若干意见》文件出台后,新一轮的电力体制改革重新启动。在电力市场的营销过程中,电力大客户创造了电力企业大部分的利润,而传统的电力大客户业扩流程存在大量重复低效的工作,严重影响了工作的效率,为此本文将在对业扩
任何歌唱片段都可能包含两种旋律:实际哼唱旋律和期望哼唱旋律。它们之间的区别在于,前者将每个哼唱音符的绝对音高作为哼唱歌旋律音符的音高,而后者将调性音级作为音符的音高。本文将期望哼唱旋律视为哼唱片段的正确旋律,提出了—种基于哼唱旋律调性分析的哼唱音符分析方法。设计并实现了哼唱旋律自动识别系统和系统性能评估方法。通过分析相邻或“间邻”哼唱音符的音程,可以估算出最匹配的哼唱旋律片段的调性。通过比较传统的
安宁河断裂带是川滇菱形块体东边界的重要断层之一,断裂带及其周边地区也是现今中国大陆构造变形特征较为显著和地震活动性较高的区域。研究现今安宁河断裂带深部的滑动速率及该区域的地震活动性对于安宁河断裂带强震危险性分析至关重要。尽管使用古地震资料及大地测量技术可以得到安宁河断裂带在历史上或现今断层在地表的滑动速率,仍无法得到现今断层面深部的滑动速率,而小震复发研究则为此提供了可能性。此外,前人基于区域台网
目前我国大陆房地产政策牢牢守住“房住不炒”的底线,同时积极改革现有不完善的金融制度、鼓励广大民众拥抱金融市场,国家政策导向清晰可见。因此,为居民家庭提出顺应时代发展的资产配置建议是进一步实现积累居民家庭财富、改善群众生活、提高我国国民幸福度的必要举措,也是党和人民共同的愿望。作者认为背景风险是影响家庭资产配置决策的重要因素,而在中国传统婚恋观念的背景下,家庭子代结构可以称之为中国特色的背景风险。本