可控闲聊对话系统的研究

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:xt100q
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网和人工智能技术快速发展的时代,对话系统以其自然友好的交互方式,促进了人和信息的连接。而在开放领域下构建的聊天对话系统,更有着广阔的研究价值和应用前景。现有的闲聊对话系统基于神经网络技术构建,往往难以控制对话回复里的属性,如生成带有高兴情感的回复。目前还不够成熟的回复可控性大大限制了对话系统的进一步研究和应用推广。因此,可控的闲聊对话生成在对话系统研究中有着重要的意义。闲聊对话系统主要基于神经网络的编码器-解码器结构,在大规模语料上以端到端的方式训练。这样的模型往往难以控制回复的特定属性,如情感,句式。具体的,情感对话控制生成是根据给定的对话输入和目标情感类别,生成符合该情感的回复;而回复句式一般分为疑问句、感叹句、陈述句和祈使句,控制句式的生成可以达到不同的回复语气和目的。因此,本文从具有代表性的情感和句式这两个可控闲聊对话生成任务为研究切入点,探索实验了如何建模输入消息和控制条件,并做出了以下工作内容和研究成果:(1)作为情感对话场景下的情感词向量,设计了基于多任务学习的情感词向量训练模型。模型结合了语言模型和情感分类任务,通过预训练-微调的方式有效的融合了语义和情感在词向量中的表示。本文提出的情感词向量可以更好地权衡语义表示和情感表示:普通词汇侧重于嵌入语义信息,而带有感情色彩的词语则包含了细粒度的情感信息。实验对比了未考虑情感信息的传统词向量,结果显示提出的情感词向量可以有效嵌入情感和语义信息,并促进情感对话的控制生成效果。(2)对于情感对话的控制生成,设计了基于内容和情感解耦表示的条件变分自动编码器模型。本文在表示学习和控制条件建模的基础上,解耦了对话的情感和内容隐变量的状态表示,并利用一种新的对偶解码器融合情感和内容信息生成回复。实验证明提出的模型可以在保持了对话生成多样性的同时,提高了目标情感在回复上的控制生成能力。(3)对于句式在对话中的的控制生成,设计了一种全局控制信号引导的层级生成模型。具体地说,解码器分为管理员和工作者模块。该模型利用条件变分自动编码器的隐变量和句式分类器抽取的特征作为全局控制信号,在管理员模块中制定阶段控制目标,引导工作者模块完成回复的控制生成。相比过去的工作,本文提出的模型不需要依赖人工整理的词汇表,训练更加端到端,同时增强了对内容和结构的控制表达能力。通过对情感对话生成和句式控制生成进行研究,本文较全面地对单轮闲聊对话的控制生成做了理论和实验上的探索和验证,对后续的对话系统研究具有重要参考意义。
其他文献
目的探讨3T MR动态增强扫描对乳腺X线摄影检出的BI-RADS3~5级微钙化病变的诊断价值。方法选取经乳腺X线摄影诊断BI-RADS3~5级微钙化病变,行3T MR动态增强检查,并经活检或手术明
PHF1(PHD finger protein1)是由位于人类染色体6p21.3上的PHFl基因编码的蛋白质,由567个氨基酸组成,因含特征性的PHD (plant homeodomain)锌指结构域而得名,现已发现其与果蝇
目的探究口服小剂量阿司匹林对于预防妊娠高血压疾病的临床效果。方法选取我院收治的确诊的妊娠高血压患者40例,其中对照组患者均给予应用静脉滴注硫酸镁的治疗,变验组患者在
云南省人力资本投资的整体思路和战略目标定位清晰明确,为社会经济的进一步发展提供了强有力的保证.但就其现状来看,在人力资本投资方面,仍存在许多问题有待解决.对此,本文进
目的探讨特利加压素治疗肝硬化顽固性腹水的疗效。方法选取2016年10月至2017年10月我方医院收治的肝硬化顽固性腹水302例患者。采用随机数字表法均分为两组。对照组151例给予
日本无产阶级文学脱胎于明治三十年代的“社会主义文学”,兴盛于大正末年至昭和十年,衰歇于昭和十年至战前,嬗变于二战后。
张家港石头港黑臭河道生态修复工程,根据污染现状进行了针对性的设计和技术优选,采用了清淤、生态拦截带、生态系统构建、PCA多维柔性土壤互助系统和景观提升等生态措施进行
目的:分析膀胱在充盈和排空状态下宫颈癌后装治疗中对膀胱及直肠受量的影响,为减少宫颈癌后装治疗后出现并发症膀胱炎及直肠炎提供依据。方法:选取20例完成盆腔外照射的FIGO分期
美学与艺术学是两门独立的学科,我们研究二者的区别是因为学科内的交叉互释是学科发展的一个趋势,而并不是将它们之间刻意划一道鸿沟。研究它们的异同,不仅使我们对美学与艺
目的:观察益气扶正汤减轻晚期非小细胞肺癌(NSCLC)化疗后迟发性呕吐的疗效。方法:112例分为实验组和对照组各56例,两组均给予格拉司琼于化疗期间静脉滴注,治疗组加用益气扶正汤。