面向电商领域的多轮次对话回复生成研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:zfjbjxw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,多轮对话回复生成任务的研究受到了学术界和工业界的广泛关注,其让计算机能够通过阅读并理解多轮对话的内容,进行逻辑分析从而给出一个契合对话内容的回复语句。一方面,多轮对话生成研究是自然语言处理领域的一项基本研究任务,对其进行深入研究有利于推动人工智能和自然语言领域的发展;另一方面,其可以满足用户交流的需求,在电商领域的应用可以起到降低人力成本的作用。本文主要针对多轮次对话回复生成展开研究,具体包括以下三个方面:首先,针对对话生成模型中多轮对话上下文之间的因果关系的难以把握的问题,本文提出了一种基于上下文相关性检测的回复生成模型。该模型能够从多轮次对话的上下文中挑选出与语境相关的子句,并据此生成回复。模型套用编码器-解码器框架,使用长短时记忆神经网络作为编码器和解码器,同时使用强化学习策略挑选相关子句。实验结果表明,该模型能够有效地挑选出相关子句,性能上明显优于传统序列到序列模型。其次,针对客服对话的生成模型回复质量不高,同时需要大量辅助信息的问题,本文提出了一种基于客服历史对话的回复生成模型。该模型旨在使用历史对话代替传统的知识库,让模型主动的在历史对话中搜寻有用的信息。模型首先对当前目标对话以及历史对话进行编码,在回复生成过程中引入注意力机制和复制机制,并使用门控机制对当前对话的上下文信息和历史对话信息两者进行加权,区别两者在回复生成过程中的重要性。实验结果表明该模型能够从历史对话中捕获关键信息,并生成高质量的回复。最后,针对存在大量无关客服与产品历史对话的问题,本文提出了一种结合并筛选商品与客服历史对话的回复生成模型。首先,我们采用“子句相关度选择模型”来衡量当前对话和历史对话之间的相关性,并从历史对话中提取最相关的子句。同时,我们使用“基于贡献的回复生成器”来衡量历史话语的贡献程度,并融合当前对话和高贡献强相关的历史对话子句以生成客服回复。实验结果表明,我们提出的模型能够生成满足历史对话特征的高质量回复,并且在真实的多轮客服对话数据集上,相较于其他基线模型优势明显。
其他文献
深度强化学习算法是近年来机器学习领域的一个研究热点。但在面对复杂环境的决策问题时,深度强化学习算法的表现仍有待提高。内在奖赏是深度强化学习领域中用于解决复杂环境中“硬探索”问题的一种重要思想。本文的主要工作从改进现有的基于内在奖赏的深度强化学习算法入手,围绕智能体样本获取速度低下、环境预测模型不准确以及易受“电视噪音”状态影响等问题展开,研究内容主要包含以下三个部分:(1)针对无模型深度强化学习算
学位
<正>夜将寒色去,共迎晓光新,进入6月,上海疫情形式好转,各行各业开始逐步回归正轨,在多方政策的助力之下,各类科技企业迈入复工复产进行时。6月14日,上海市科学技术委员会副主任陆敏走进上海市科技创业中心孵化基地(以下简称“创业中心”),走访多家在孵企业,实地调研科技企业复工复产情况,了解企业当前复工复产中所面临的挑战。
期刊
基因表达的生物系统受到DNA和转录因子(Transcription Factor,TF)相互作用的调控。在TF结合域发生的核苷酸变异在人类疾病中扮演着重要角色。染色质免疫沉淀测序技术(ChIP-seq)可以高通量检测DNA-TF结合性的生化性质。本文基于这类数据展开三项计算研究。首先,通过深度学习模型学习DNA序列的嵌入表达,然后用支持向量机训练预测DNA-TF结合特异性,取得了优秀的效果;同时对
学位
文章分析了公立医院成本核算中存在的问题,找出了影响公立医院成本核算的重要因素,并针对这些重要因素提出了一些可行的改进建议,从而帮助公立医院提升成本核算的水平。
期刊
随着信息时代的迅猛发展,网络信息越发充斥着人们的生活,如何从海量数据中为用户提供有效的个性化信息成为推荐系统的主要目的。序列推荐作为一项考虑用户行为时序性的推荐任务,恰好迎合了用户兴趣随时间不断演变的特性,而会话推荐是一种用户身份未知的序列推荐,仅依赖当前会话中的有限序列作出推荐并满足用户需求。由于用户在各个领域都有其个性化的品味,所以在序列推荐中,用户偏好不仅具有动态性,还具有多样性。本文将利用
学位
面对传统农机动力源向电力转变的趋势,结合传统高速永磁无刷直流电机的控制策略,针对低速大扭矩永磁无刷直流电机的特点,本文在转速、电流双闭环的基础上采用矢量控制技术,通过仿真实验,与直接转矩控制在低速大扭矩永磁无刷直流电机的控制方面的性能进行对比,证明该策略对于低速大扭矩永磁无刷直流电机的控制能起到较好的效果,对于低速大扭矩永磁无刷直流电机的控制研究有一定的参考价值。
期刊
目的:了解2型糖尿病患者及其配偶二元应对、患者糖尿病自我管理、夫妻双方主观幸福感的现状,分析影响患者和配偶主观幸福感的因素,患者二元应对与疾病自我管理的关系,建立主客体互倚模型分析2型糖尿病患者及其配偶二元应对水平对双方主观幸福感的预测作用,为科学制定护理干预方案提供理论依据,以期提高糖尿病患者和配偶的二元应对和双方的生活满意度。方法:采用便利抽样的方法,研究对象选取2019年11月至2020年1
学位
直线段是一类重要的图像特征,能够有效表达场景的几何信息和拓扑信息。现有的直线段检测方法广泛存在直线段端点定位不准或方向不准等问题,且均针对灰度图像来设计检测方案,丢失了图像的部分彩色信息,从而导致检测效果不理想。在评估直线段检测结果时也存在一些明显的问题,如检测到的直线段与真实直线段之间的映射关系不合理,未对直线段过融合、过分割和方向偏差进行惩罚等,无法有效反映检测算法的真实性能。针对直线段端点定
学位
文章介绍了气象观测质量管理体系建设的依据及江西省气象观测质量管理体系建设和运行过程,总结了体系持续运行的经验和体系运行中的常见问题。实践证明,气象观测质量管理体系的建设与运行促进了综合气象观测业务发展。
期刊
目的1)了解慢性阻塞性肺疾病(Chronic Obstructive Pulmonary Disease,COPD)患者吸入制剂使用依从性的现状。2)探索基于目视管理法的可视化健康教育对COPD患者吸入制剂使用依从性、吸入制剂使用方法掌握程度、肺功能、生活质量及运动耐量的影响。3)比较基于目视管理法的可视化健康教育和常规健康教育的应用效果,为改善COPD患者吸入制剂使用依从性提供理论及实践基础。方
学位