基于任务型对话的政务智能客服系统的建模与实现

来源 :中央财经大学 | 被引量 : 0次 | 上传用户:runzhong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能客服系统是任务型对话中的一个重要应用。智能客服系统相比人工客服而言,解决问题能力更加高效,而且成本更低,因此受到了工业界大量企业的亲睐。比如在电商领域,阿里小蜜、京东小咚等产品都是典型的智能客服系统。在政务客服领域,同样需要智能客服助力。目前,很多政府部门都提供了智能客服系统,比如北京政府的智能咨询机器人“京京”、上海政府的智能客服“小申”等。这些政务智能客服系统可以为公众提供权威的政策咨询服务,大大提升了公众的使用体验,提高了政府网站的在线服务能力和水平。本文基于任务型对话,将深度强化学习技术应用于政务智能客服系统的实现中,以改进当前政务智能客服系统存在的问题,从而使政务服务更加智慧化,进一步提高我国政务平台服务水平。当前的政务智能客服系统通常存在如下问题:1)基于向导的咨询系统:通过向导程序实现办理业务定位然后进行信息反馈。其流程复杂,每次交互咨询人只能输入很少信息,导致花费大量时间用于逐步完成信息输入与判断。2)基于检索的咨询系统:没有真正的咨询系统,通常利用文件检索系统替代咨询系统。3)提供基于对话的咨询系统,总体上仍然是向导程序的自然语言版本而已。本文的创新点是基于深度Q网络技术,构建一个DQN Agent对话策略学习模型,并把它应用于政务智能客服系统的对话策略模块。与传统的基于FAQ检索或者基于规则的对话系统相比,本文构建的基于DQN智能体的政务智能客服系统更具有灵活性和智能性。本文致力于实现一个服务于电子政务咨询领域的智能客服系统,提出使用深度强化学习方法,去解决智能客服系统对话策略的学习问题。基于深度强化学习方法的对话策略学习模型可以使得智能客服系统能够在更多的任务领域中应用,帮助用户完成更多的任务。结合电子政务咨询领域中的业务诊断任务,本文对基于深度强化学习的对话策略学习模型的设计、构建、实现以及这种方法实现的性能质量、优缺点等方面进行了研究。并详细介绍了基于任务型对话的政务智能客服系统的实现过程以及DQN Agent模型是如何指导该智能客服系统进行对话决策。本文主要包括如下内容:(1)基于深度Q网络方法构建政务智能客服系统的对话策略学习模型。该对话策略学习模型使用深度强化学习算法——深度Q网络DQN算法来构造一个智能体DQN Agent。本文在训练DQN Agent时,采用了强化学习中著名的ε贪婪搜索(ε-greedy exploration)策略,从而可以尽量多地探索到不同对话状态下的奖励值Reward情况。相比于其他对话策略学习模型,本文基于深度Q网络方法构造的对话策略学习模型完成任务所需要的对话轮数更少,并且在策略探索上更具有个性化。(2)构造电子政务咨询领域的对话数据集。由于目前政府的政务电子化在全国各级政府中的覆盖率并不高,并且由于政府事务具有保密性等原因,政务咨询领域内目前还没有高质量的对话语料公开发表。因此本文结合电子政务咨询领域的实际应用场景,比如首次办理护照、养狗登记、补办港澳台通行证等任务场景,构造了上千段不同对话场景的中文数据集。除此之外,本文还将已经构造好的语料进行分词和标记,处理成槽值对信息的格式,以便用于对话策略学习模型的训练。
其他文献
当下人口老龄化问题严峻,社保征收压力较大,为了加强社保费的征收,我国于2011年7月1日在全国范围内正式推行《社会保险法》,完善了相关的法律制度。由于之前我国社保工作的合规性较差,《社会保险法》的实施能够对全国的社保工作进行统筹,规范征管工作。有很多文献研究证实了该项措施对改善我国社保费的征收情况发挥了很重要的作用,在《社会保险法》实施之后,企业的参保程度明显提升。但另一方面,由于之前我国社保费的
学位
立场检测旨在判断一段文本的作者对某个目标(主题,观点)表示赞成,反对或中立的立场。学术界和工业界都十分关注立场检测任务的发展,在许多不同的领域中逐渐浮现立场检测的实际应用,例如医疗决策、产品调研、政治选举等等。其中,在政治选举领域中最常见的应用是民意调查或民意投票,使用自动立场检测技术,检测出一个地区(或网络社区)的群众对政策法规等的反应,维护社会安全与稳定。决策者可以获知群众对其决策的立场反馈,
学位
在当今这个互联网平台迅速发展的时代,人们对于精神娱乐的需求更加迫切,音乐成为人们精神娱乐的一种重要方式,互联网音乐平台蓬勃兴起。但海量的音乐信息让人眼花缭乱,如何解决信息过载问题、给用户提供个性化的音乐推荐成分为网络音乐平台发展的关键。本文梳理了传统推荐算法的发展过程与研究现状,发现单一的推荐方法存在一些缺陷,如用户特征画像难、新用户冷启动、推荐精度低、数据稀疏等问题。后续学者逐步使用更加多样的方
学位
随着世界城市化进程的不断推进,城市建筑需求量急剧增加,其相应的一系列建材和资源也产生了广阔的市场。识别建筑结构类型是衡量特定建筑所需建筑资源负担的先决条件,有助于建立建筑结构、材料和资源需求之间的联系以及建筑物抗震能力检测等等,从而有助于建立智慧城市形态、推进城市新陈代谢和生态规划等可持续城市研究。机器学习可有效助力建筑结构分类问题,其通常需要大量的有标注样本作为训练集构建机器学习模型。但在实际应
学位
近年来,数字化开始成为了世界商业环境中关注的重点,众多金融企业都在积极地向数字化、智能化方向转变,而中国也在十九大中明确提出了要加速构建数字中国。而这一数字化浪潮,离不开以区块链为代表的新技术的支撑。传统金融的数字化是大势所趋。供应链金融是一种全新的金融业务,其核心功能是银行将核心企业与其上下游企业捆绑在一起,并提供如融资贷款等相关金融服务。该金融业务诞生的初衷是为了解决小微企业难以融资的问题,然
学位
随着我国资本市场不断发展,上市公司数量不断增多,财务舞弊案件层出不穷,扰乱我国资本市场的同时也造成了投资者的经济损失。进行公司的舞弊识别成为对于上市公司监管的重要任务,有利于维护投资者利益和资本市场稳定。本文将研究目光放在年报文本上,将年报文本中的管理层讨论与分析文段作为研究对象,从多个角度对于年报文本中信息量含量较大的管理层讨论与分析文段进行文本特征提取,加入到舞弊模型中,查看文本特征对于舞弊识
学位
信用风险是信贷业务的主要风险来源。近年来,随着社会经济的快速发展,信用消费的经济形式越来越普遍,违约风险也随之增多。我国目前的信用现状仍存在很多问题,严重的违约风险很大可能会影响社会经济的健康发展。如何准确和全面地对个人信用风险进行评估是银行等金融机构的重要任务和必然要求。传统的信用风险评估方法过于依赖个人征信,缺乏时效性和全面性。大数据时代的到来提供了丰富的数据,加上深度学习技术在多个领域内的成
学位
从上世纪60年代诞生至今,电子游戏产业发生了翻天覆地的变化,特别是伴随着2021年以来元宇宙的异军突起,由于其自身特性与电子游戏的追求不谋而合,使得电子游戏再次受到了人们的广泛关注。诸如寻路及难度预测两大问题对于游戏的设计与开发至关重要。寻路系统是指通过一定算法在最短时间内,为角色找到一条从起点到终点、无碰撞的最短路径。因为寻路的效率影响游戏智能体决策的能力,因此寻路系统的优劣在很大程度上决定了最
学位
随着互联网行业的发展,金融机构信息化转型的需求也越来越大,互联网金融业务应运而生。互联网金融业务改善了传统金融交易模式,促使金融业的发展和变革。然而,大量互联网金融业务的涌现也直接导致了风险问题的集中爆发。信用卡欺诈、贷款逾期、贷款坏账等不良金融事件时常发生。为了维护经济市场秩序,保障金融行业持续发展,我国政府高度重视互联网金融业务出现的问题,颁布相应法律法规等文件,针对风险问题开展专项整治工作。
学位
在金融市场中,波动率作为衡量金融资产价格波动剧烈程度的指标,对于刻画金融市场中的风险有着重要指导作用。相比以日、月为单位的低频数据,以秒、分钟、小时为采集频率的日内高频金融数据,不再服从正态分布假设,整体上呈尖峰厚尾性质。较高的采样频率,使得高频金融数据能够对市场微观结构进行更准确的预测,因此,大量学者展开了对高频金融数据波动率的探索。在计量经济领域,学者们尝试采用参数估计方法,描述高频金融数据的
学位