基于深度学习的多轮对话算法研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:liongliong504
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多轮对话模型能够根据对话上下文信息给出最契合对话上下文的回答,在个人助手、智能客服、教育辅导等领域都存在广泛的应用。如何根据对话上下文信息给出准确的回答是多轮对话模型研究的关键点,现有模型存在关键信息难以提取、句子粒度信息不够丰富、对话上下文长期依赖难以捕获等问题,限制了多轮对话模型效果的提升。针对上述问题,本文的主要研究内容如下:1)现有的多轮对话模型存在未登录词频繁出现、句子粒度信息不足导致语义缺失、无关信息交互影响匹配效果等问题。针对上述问题,提出了一种结合词注意力机制的多粒度循环神经网络模型(Multi-Granularity Recurrent Neural Network with Word Attention,MRNA)。为了获得更准确的语义表征向量,MRNA对字符级信息和词语级信息进行融合,增强了向量的表示并缓解了未登录词的影响。MRNA采用AHRE(Attentive Hierarchical Recurrent Encoder)对对话上下文和回答进行层级编码,将编码后输出的句子切分为前向序列相似度矩阵和后向序列相似度矩阵,并且结合词矩阵从而获得多粒度的语义匹配信息,丰富了匹配信息的表示从而防止出现语义缺失的现象。为了在语义匹配过程中充分提取对话上下文和回答中的相关语义信息,MRNA使用词注意力机制,动态地学习注意力矩阵的权重,从而提取与对话上下文和回答最契合的关键信息。在Ubuntu和Douban数据集上的实验结果表明,MRNA模型都取得了优于对比模型的实验结果。2)MRNA模型虽然在提取句子层级粒度信息等方面获得了提升,但是还是存在无法有效提取对话上下文的长期依赖关系、句子中的关键信息得不到有效利用等问题。针对上述问题,本文提出了一种结合上下文建模与多头注意力机制的深度神经网络模型(Context Modeling Network with Multi-head Attention,CMNMA)。CMNMA采用多头注意力机制对对话上下文和回答进行编码,把句子切分为多个子句分别使用注意力机制进行计算,使得每个子句可以分别提取其中的关键信息,最后融合每个子句并生成优化后的句子级表示。为了提取对话上下文和回答之间的长期依赖关系,CMNMA提出了基于旋转记忆单元(Rotational Unit of Memory,RUM)的上下文语义信息提取模块,RUM通过旋转的方式来操作隐藏状态,避免了参数化正交运算,从而防止操作过程中造成隐藏状态的丢失并更有效提取句子之间的依赖关系。在Ubuntu和Douban数据集上的实验结果表明,CMNMA在捕获对话上下文和回答之间的长期依赖关系、提取句子中的关键信息等方面均优于对比模型。
其他文献
随着集成电路先进技术节点步入微纳米时代,电路的复杂度呈指数级增长,同时布线过程要求全部总线位均需保持同一布线拓扑结构,尤其还存在布线轨道不均匀以及分布在各布线层的障碍物等问题,这给总线布线过程带来巨大的挑战。本文在当前总线布线研究的基础上,运用基于拆线重布的方法对总线布线过程中所涉及到的拓扑匹配问题展开深入研究,提出了一种在先进制程下的优化方案以解决上述问题。首先提出了基于拆线重布的拓扑匹配全局布
学位
在临床上,对外周血白细胞进行分类识别是血液自动检测中一项重要的内容,实现端到端的外周血白细胞检测有着重要的意义。然而由于外周血白细胞同类之间形态变化大,血液显微图片背景复杂等问题,外周血白细胞识别准确率相对较低。并且现有方法大部分采用的是“先分割后分类”的做法,使得这些方法对外周血白细胞分类的准确性受到了分割效果的限制。针对上述问题,根据外周血白细胞检测的实际需求,本文研究外周血白细胞自动检测的方
学位
图像描述任务旨在使计算机能够根据图像自动生成对应的描述语句,即完成从图像模态到语言文字模态的转换。近年来,随着深度学习技术的兴起,该领域已成为新兴的研究热点并取得了显著进展。尽管如此,仍然存在一些挑战:模态转换的中间表示对于图像语义信息的刻画不够准确;缺乏对历史解码信息和图像背景信息的有效利用;未充分考虑不同粒度图像语义信息的交互。针对上述问题,本文进行了以下三个方面的工作:(1)针对现有方法在模
学位
选址的研究内容非常广泛,从城市规划、机场建设到配送中心、零售店的位置决策都是选址研究的范畴。随着当代社会发展和智慧城市建设,商家选址成为市总体规划中的重要一环。商家选址关系着城市商业的繁荣发展,关系着商家的经济收益,直接影响进店客流、服务内容和运营成本。因此,科学合理的选址对商家而言至关重要。早期获取数据的途径和数量有限,选址决策易掺杂着主观因素,导致准确率不高。随着互联网的发展,可以通过多种途径
学位
电能是人类生产实践活动中至关重要的能源。随着社会工业化地不断发展,人们对电力资源的需求日益增加,与此同时,窃电行为造成的损失也在不断增加。因此,窃电行为检测对于规范用户用电行为,提高企业管理水平和经济效益具有重要意义。传统的反窃电技术存在耗费人力物力大、误报多、效率低等问题。随着智能配电网和大数据技术的发展,通过将大数据技术应用于窃电检测系统可以显著地提高电力公司在进行反窃电工作时的效率。论文根据
学位
进入信息时代,许多事物可以被数据化,形成一个个数据实体。复杂网络作为这些数据实体以及实体间联系的抽象表示,有着许多现实应用,如交通运输网络、生物蛋白网络和社交关系网络等。复杂网络形式多样,如具有节点特征的属性网络、具有不同类型节点和边的异构网络等,给复杂网络的分析带来更大的挑战。社区结构是复杂网络的重要特性,描述了网络中节点在空间上的聚集性以及在特征上的相似性。社区发现旨在挖掘网络中的社区结构,从
学位
数字图像在传输过程中无法避免会遇到图像退化现象,使用图像复原技术作为数字图像的预处理是一个非常有效且重要的环节。图像复原的目标是一个将退化图像恢复成原始图像的过程,这一过程事实上是求解病态逆问题的过程。基于非局部自相似性的图像复原已被证明是有效的图像复原技术,但是如何将图像块更好地划分开来是图像复原效果好坏的关键。通常使用聚类算法来实现对图像块的划分,因此如何提升聚类的精度也是提升图像复原能力的研
学位
许多现实世界的系统都会产生结构化的数据,而结构化数据的知识发现需要使用由节点与节点之间的连接构成的网络数据。在一些真实场景,例如社交网络、通信网络以及金融交易网络中,这些结构化数据通常是动态变化的,即网络中的节点或者边会随着时间的推移而动态地演变。时序信息是动态网络的重要组成部分,反映了网络结构的演化机制。以社交网络为例,它的拓扑结构随着新用户的增加、好友关系的建立和解除而不断发展。对既有演变规律
学位
聚类旅行商问题(CTSP)是旅行商问题(TSP)的一个重要扩展问题,在路径规划领域吸引了许多的研究者关注。给定带边权的无向完全图G=(V,E),其边代价满足三角不等式,顶点集V被划分为几个簇,问题的目标是计算一条访问所有顶点的代价最小的哈密顿回路,并且每个簇中的顶点都被连续访问。在许多的实际应用中,往往需要考虑一些其他因素的制约,因而产生了 CTSP问题的一个重要变体—广义聚类路由问题(The G
学位
文本情感分类旨在挖掘和分析文本中的态度、观点等主观信息以判断文本情感倾向性,是自然语言处理领域的热点研究问题之一。目前,研究学者们构建了一系列基于深度神经网络的情感分类模型,取得了瞩目的成果。尽管如此,仍然存在一些问题:以往方法未充分考虑文本中单词歧义性对情感分类的影响;已有方法难以捕捉输入文本单词与句子的多重语义信息;现有模型中长短期记忆网络训练速度较慢。本文围绕上述问题展开研究,具体可分为如下
学位