基于主题模型与变分自编码的情感对话生成技术研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:ning211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人机对话作为人工智能领域的核心技术之一,以其广阔的应用前景以及诱人的商业价值备受学术界和工业界的瞩目。从早期的Eliza和Parry,到类似Siri的智能个人助手,再到如今的聊天机器人,如小冰,人机对话系统不断地改变着人们的生活。聊天机器人,旨在通过人机交互中自然、流畅且多样的对话以满足人类的交流以及情感陪伴的需求。因此,一个出色的聊天机器人应该同时具备智商和情商。然而,现有的对话系统的研究工作主要聚焦于改善句子的质量,对于情感的关注还相对较少。因此,本文主要关注情感对话生成,该任务旨在生成蕴含情感且语义流畅的回复,从而实现更加自然的人机交互。近年来,随着深度学习技术的流行,研究人员逐渐采用seq2seq生成模型来实现对话系统,而不仅是依赖基于模板和检索等方式。因此,本文分别将seq2seq模型与主题模型和变分自编码器相结合来提高回复的相关性和多样性,并且在此基础上融合情感因素,使得模型能够生成蕴含情感的回答。本文的主要工作如下:1)为了生成蕴含情感且与输入内容相关的回复,本文将情感因素和主题信息同时与seq2seq模型相结合,构建了一个基于注意力机制的主题增强情感对话生成模型(TE-ECG)。该模型首先通过基于双向长短期记忆网络的编码器对输入进行编码,然后利用一个Twitter LDA模型获得输入的主题词作为模型的额外输入,主题信息的融入使得输入和输出共享同一主题,保证了回复内容的相关性。最后,模型通过动态情感注意力机制同时捕捉输入文本及额外的主题词中与情感相关的信息。本文在NLPCC-ICCPOL 2017发布的情感对话生成语料上进行了实验。基于人工评价和自动评价的实验结果表明,TE-ECG在各项指标上相比其他方法均有一定的提高。2)TE-ECG模型融入了情感的同时改进了句子的质量,但回复内容仍然缺乏多样性。为了缓解这个问题,本文提出了基于变分自编码的情感对话生成模型(VAE-ECG),其利用VAE的特性能够更好地对文本的潜在语义进行建模。该模型分为三个模块:变分编码器用来编码输入和输出序列;变分推理是为了对隐变量的近似后验分布进行建模;变分解码器利用上下文语义向量、隐变量以及情感状态解码得到生成的回复。本文在NLPCC-ICCPOL2017发布的情感对话生成语料上进行了实验。基于自动评价的实验结果表明,VAE-ECG模型在基于Unigram和Bigram的多样性指标上相比其他基准模型均有一定的提高,验证了该方法的有效性。
其他文献
跨文化冲突是国际企业在国际化进程中不可避免的问题,仅从一般理论探讨应对冲突的管理策略缺乏实践意义。文章认为企业应根据自身的内外部环境以及战略目标来制定跨文化冲突
随着我国经济的快速发展,废水排放量不断增加,2005年全国废水排放量高达524.5亿吨,其中工业污水排放量243.1亿吨,生活污水排放量281.4亿吨。与之相反,水环境容量却不断降低,
壮锦作为中国的第一批非物质文化遗产,其纹样是中国西南地区民间独具民族特色的的织锦纹样之一,产自中国人口最多的少数民族——壮族。以往的壮族民间织锦纹样多存在于当地少
潜射反舰导弹由于其发射平台的特殊性,而具有弹道复杂的特点,导致其发射技术和射击诸元计算的难度较大。发达国家的潜射反舰导弹研制技术不断进步,水下动力发射、超低空飞行
在赤峰的城镇化建设中,社区管理干部认识帮助居民解决心理问题对于社区服务具有明显的作用.为满足社区居民对心理卫生服务不断增长的需要,建立健全良好的社区心理卫生服务机
燃煤电厂烟气中的二氧化硫是我国大气污染的主要原因之一,采取有力措施加快烟气脱硫步伐已刻不容缓。烟气催化还原脱硫技术是用催化剂将烟气中的二氧化硫选择性地还原成单质
采用随机区组试验设计研究了赣南生态条件下移栽期和移栽方式对烤烟生长及产质量的影响。结果表明,膜下小苗移栽能够促进烟株前期生长和烤后烟叶经济性状,但烤后杂色烟叶比例
生态环境在云南"直过民族"地区扮演着重要的角色。作为社会发展的特殊地区,云南"直过民族"地区生态文明建设有其特殊之处。本文分析了云南"直过民族"地区生态文明建设的特点,
调整图层是非线编软件PREMIERECC中的重要新建项目对象,在影视后期的效果处理和制作过程中具有重要作用。调整图层的基本特性包含透明性、承载性和轨道性,这使它具备了一般素材
由于超高层施工的特殊性,安全防护一直是整个施工管理中的重点和难点,因此临边防护,层间水平防护,塔式起重机洞口甩项处的安全防护及外侧水平防护都是需要注意的重点部位。如何在