基于深度匹配网络的检索式闲聊对话系统

来源 :天津大学 | 被引量 : 0次 | 上传用户：songxin_gkong

【摘要】

：

【作者】

：

杨婷

【机构】

：

天津大学

【出处】

：

天津大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人机对话系统旨在能够使人与机器进行自然的言语交互,是人工智能一个核心的研究问题。近些年来,构建开放域对话系统让人们越来越感兴趣,因为开放域对话系统能够实现机器与人在广泛话题下的自然交流。检索式开放域对系统从预先建立的回复候选中选择最匹配的回复,返回的回复往往是流利的,并且信息含量丰富。本研究的目的是为了探究有效的深度匹配网络来进一步提升多轮检索式对话系统的性能。最佳的回复候选往往根据对话上下文进行选择。传统的方法将整个对话上下文中的语句拼接起来与回复进行匹配,可能会导致丢失重要的语句信息。目前流行的序列匹配模型通过一个表示-交互-融合框架让回复候选与对话上下文中每轮语句进行匹配,但是对于表示阶段对话上下文中语句之间的依赖关系以及交互阶段全局信息指导关注不够。这可能会导致挖掘到的语句-回复对的匹配特征可能是片面的甚至是错误的。因此本研究提出了一个新颖的分层交互匹配网络在统一的框架下同时建模上述两个方面,在分层交互模型中,我们提出利用多级注意力机制来建模对话上下文中相邻语句之间的依赖关系。并且在分层交互匹配过程引入全局信息指导来协助每个语句-回复对挖掘重要匹配特征。在对话过程中,人们往往会借助背景知识,因此除了研究传统的对话上下文-回复匹配问题,我们还研究了以背景文档为基础的回复选择。最佳的回复不仅要与对话上下文相一致并且要与背景知识相关。目前的研究方法多关注让背景文档与对话上下文进行交互来得到更好的表示,然而仅一次交互限制了对于背景文档以及对话历史的理解。我们对于背景文档和对话内容的理解往往是多次的,并且每次可能关注到不同的子部分。因此本研究还提出了一个多步推理匹配网络,在预训练编码层的基础上,为了找到推理链,模型首先对背景文档进行选择,然后改善对话上下文表示,最后利用选择后的背景文档知识和改善后的对话上下文表示与回复表示进行匹配。对于对话上下文-回复任务的分层交互匹配网络,我们在通用豆瓣数据集和淘宝电商数据集上进行验证。对于以背景文档为基础的多步推理匹配网络,我们在通用数据集PERSONA-CHAT数据集上进行验证,与基线模型相比较,本文提出的模型均表现出很好的性能。

其他文献

基于对抗神经网络的烟雾模拟技术研究

在计算机图形学领域中,流体模拟一直是热门的研究方向之一。传统的流体模拟通过求解物理方程实现,这类方法能够得到非常真实的效果,但是往往会受到计算资源的限制。随着深度学习技术的不断发展,将流体模拟与基于数据驱动的方法相结合成为了一种新的研究趋势。本文在深度学习算法的基础上,针对超分辨率流体中存在的问题进行了研究。本文基于生成对抗网络（GAN）提出了帧间插值的算法,来增强超分辨率流体的时序一致性。使用G

学位

基于边云协同计算模式的多社区种子用户选择优化研究

近年来,移动网络流量的激增给移动网络运营商带来极大的挑战,也导致用户体验降低。D2D（Device-to-Device）技术是一种基于设备直连的面对面内容传输技术,可以缓解流量激增问题。我们可以在D2D社区中选择有影响力的种子用户,促进线下内容的传播,卸载网络流量,提高D2D软件的活跃度。然而,目前的一些种子用户选择算法产生影响力重叠的问题。种子用户选择是一个持续的过程,在传统的集中式云计算模式下

学位

基于核方法的深度学习泛化理论

深度学习在许多领域都取得了经验性的成功,但是它们仍然缺乏理论上的理解。核框架的优雅性确保了可以使用各种数学分析技术解析地研究深度学习,核方法对于深度学习泛化理论的研究存在着很大的发展空间。本文主要使用核方法从深度核学习的泛化性分析以及优化算法的隐式正则化角度来研究深度学习的泛化理论。主要内容如下:1.提出了基于Rademacher复杂度和Rademacher chaos复杂度的深度核学习泛化误差界

学位

图卷积神经网络的拓扑限制研究

图卷积神经网络（Graph Convolutional Networks,GCN）是一种新兴的高效且有效的网络表征学习技术,目前正在被研究者们所广泛的研究着。然而已有GCN方法往往受限于网络拓扑的同质性假设,即邻居结点的特征被期望更加相似。但如果网络拓扑不符合该假设,则节点将会聚合过多噪音特征,导致节点表征无效。最近也有一些研究者来尝试解决上述GCN的拓扑限制,然而这些方法主要是通过如何修正或更好

学位

基于语谱图融合的语音增强

在近些年,作为人机交互的一种重要方式,人们更加广泛地关注语音产品。语音产品的广泛应用,极大的解放了人们的双手,从而使日常生活变得更为方便。在较为干净的情况下,排除说话人自身的因素,语音应用已经能够取得很好的性能。例如,语音识别能够在干净的环境下,获得超过95%的准确率。但是,大量的噪声往往会在现实环境下存在,语音应用的性能也因此会受到极大的影响。从带噪语音信号中提取干净的语音信号的一种常用技术,被

学位

抗性淀粉的制备、来源、健康收益及其展望

淀粉是人类饮食中维持正常身体能量代谢的最重要的碳水化合物之一。抗性淀粉（RS）是淀粉的一部分，这种淀粉在体内消化速度十分缓慢，意味着进入血液速度也会减慢，其性质类似溶解性纤维。抗性淀粉可通过多种不同的制备工艺，来提高抗性淀粉的含量，保持抗性淀粉的性能。RS因其独特的功能特性和健康益处而发挥了非常重要的作用。RS的有益作用包括控制血糖、控制空腹血浆甘油三酯和胆固醇水平以及吸收矿物质。此外，了解RS与

期刊

炮位侦校雷达定位精度影响因素分析

炮位侦察校射雷达弹道外推算法受多种因素影响。为满足弹道外推分析、进一步提高外推精度的需求，详细建模分析地球曲率、时间不同步、弹道模型误差、信噪比变化等影响炮位侦校雷达定位精度的因素。结合精密雷达测量数据和无迹卡尔曼滤波外推算法进行仿真，量化评价各因素对外推精度的影响。通过理论建模与仿真实验，将考虑各种影响因素与否的情况详细分析对比，得到各因素对定位精度影响程度从大到小依次为：地球曲率、时间不同步、

期刊

基于概率张量评分的线下移动社交网络链接预测算法研究

随着移动社交网络（Mobile Social Networks,MSNs）中文件重复传输频次逐渐增大,流量爆炸问题日趋严重。作为支持5G本地服务需求之一的“设备-设备”（Device-to-Device,D2D）技术,可不经过基础设施进行短距离通信,有效实现主干网流量迁移,提升用户体验。如何充分利用网络结构、链接关系等多维度的用户交互属性,是构建有效的D2D线下社交网络关系链接预测模型的关键问题。

学位

基于三维唇部动作的说话人识别技术研究

随着科学技术的进步与人们安全意识的提高,身份识别技术得到了人们的广泛关注。据统计报道,有近一半的用户曾因丢失移动设备导致敏感信息泄露。因此,如何保证个人信息安全成为一个需要迫切解决的问题。最初的用户身份识别技术采用密码口令的验证方式。由于密码存在易被窃取的不足,基于生物特征的身份识别技术被提出。唇部动作作为一种生物行为特征,包含的个人特征能被用于说话人识别系统。当前基于唇部运动的说话人识别技术都是

学位

比例原则在羁押必要性条件中的适用

作为审前羁押制度核心条件的羁押必要性，集中体现了比例原则的内容与要求。本文立足于我国审前羁押制度的具体实践，以审前羁押制度目的为依据，通过比较借鉴域外审前羁押制度中比例原则的具体内容，对羁押必要性条件进行合目的、体系化的解读。应当在刑事诉讼全流程和全部逮捕类型中对羁押必要性条件的有无和高低进行实质性判断，提高未成年人的羁押必要性条件，对一般性羁押事由和预防性羁押事由作不同的解释限度要求，以确保审前

期刊

基于深度匹配网络的检索式闲聊对话系统

与本文相关的学术论文