基于金融领域对话系统的意图识别研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:crosslightning
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人机对话技术的不断发展,各种各样的智能对话系统层出不穷,如:领域问答系统、闲聊机器人、终端导航机器人等智能产品,很大程度上方便了人们的日常生活。在各种类型的对话系统中,任务型对话系统是一个重要分支,主要通过多轮交互解决用户在某个领域遇到的问题,提高业务办理效率,减少人工参与。本文针对金融领域任务型对话系统的用户意图识别进行研究,包含领域分词优化、对话意图识别以及融合意图识别的智能对话系统的设计和实现,详细内容如下:1.提出PSLL-Bi GRU-CRF算法解决金融领域分词的权重倾斜问题。意图识别的首要任务为对话文本的特征表示,而领域分词作为特征表示的第一步,往往面临高质量标注样本稀疏的问题。针对此问题,本文提出随机伪标注样本机制,抽取大量金融领域的专业词汇,并通过unequal-random的方式抽取多个词汇进行连接补齐操作,生成5796条伪标注样本进行模型迭代训练,提高金融实体信息在模型中的权重值。同时,为了进一步解决序列化标签之间逻辑依赖问题,利用条件随机场来避免非法标签序列的预测输出。通过实验证明,PSLL-Bi GRU-CRF算法能够在领域样本稀疏的情况下保持较高的意图识别准确率,相对通用分词算法,性能更好。2.提出IEBERT-Bi LSTM算法解决文本词汇歧义问题并实现多轮对话的意图继承。传统的对话文本的意图识别中,多义词常常会被映射到同一向量上,造成语义理解偏差。针对此问题,本文利用masked机制通过前后词汇判断当前词汇的语义环境,来动态生成当前词汇的向量表征,解决词汇歧义问题。为进一步提高多轮对话意图识别准确率,提出IEBERT-Bi LSTM(Intentions Embedded in BERT Bi LSTM,简称IEBERT-Bi LSTM)算法来将上一轮对话意图嵌入到当前对话中,实现意图继承,提高意图识别准确率。同时,针对多意图识别问题,提出动态阈值设定算法进行多意图检测。通过实验证明,IEBERT-Bi LSTM结合动态阈值设定算法在单意图和多意图识别任务上,对比实验中的其他模型,综合性能最好。3.融合意图识别的金融领域智能对话系统的设计和实现。金融领域智能对话系统对安全性、负载性和响应速度要求较高,基于此特征,本文从对话系统的项目需求、系统架构、系统数据库、前端界面等方面进行详细的分析和设计,并采用Java Spring Boot框架进行对话系统的工程实现。最后,对系统从功能和性能两个方面进行综合测试,单轮和多轮对话准确率分别达91.77%和87.38%,同时,系统能支持1000的并发量正常运行,保证500的并发量能够在2000ms内给出快速应答。
其他文献
近年来,随着人工智能和计算机视觉的飞速发展,图像补全已成为重要的研究领域,被广泛应用于摄影、安防、医学等各个行业。传统的图像补全算法在实际应用中效果并不理想。随着近几年深度学习在图像处理领域不断取得显著成果,生成对抗网络(Generative Adversarial Networks,GAN)凭借强大的特征表达和学习能力逐渐替代了基于像素扩散和基于补丁块类的传统图像补全算法。本文分析国内外图像补全
滴滴等网约车已成为人们出行的主要方式之一,保障司乘安全、减少交通事故是所有网约车平台的核心关注点,疲劳驾驶、分心驾驶等异常驾驶行为是引发交通事故的重要因素。目前,网约车平台避免疲劳驾驶的解决方案主要是对驾驶员的驾驶时长计时,超过指定的时间后就停止给驾驶员派单。这种一刀切的解决方案,没有根据每个驾驶员的具体情况而制定不同的监管措施,而对于分心驾驶,此类平台目前未采取有效的措施进行监管。针对上述问题,
随着互联网的快速发展,网络中涌现出大量的匿名文本,这些匿名文本中不乏充斥着虚假信息、诈骗信息、甚至是危害国家安全的谣言信息。特别地,暗网因其与生俱来隐匿性,已经成为不法分子犯罪的理想场所。文本作者识别技术可以较好的发现并追踪网络文本的作者,从而打击、预防网络犯罪,维护网络环境的健康安全。现有的文本作者识别技术针对网络文本进行作者识别,其准确率及可靠性较低,且在文本特征筛选过程中人工参与度较高。因此
医学图像分割在定量分析、临床诊断和治疗过程中扮演着重要角色,基于编解码器架构的分割模型被广泛应用到医学图像分割中。在实际分割中,由于编解码器架构的编码器、跳跃连接、解码器组件的设计不合理,会导致出现多尺度特征融合不当、相似特征不相关、特征通道直接拼接引起语义鸿沟、上采样过程抽象特征丢失而利用不充分以及网络参数量冗余问题。这些问题是医学图像分割中的重大阻碍,本论文针对编解码器架构在分割中关键技术进行
磁共振成像(Magnetic Resonance Imaging,MRI)技术自1973年成功显示图像以来得到了迅速发展,已成为最有价值和应用最广泛的诊断成像方式之一。核磁共振系统对于接收线圈的信噪比具有较高的要求,高温超导技术对于高灵敏度的接收核磁共振模拟通路的研制具有重大意义。本文以利用高温超导薄膜材料研制了在1.5T磁场中、63.5MHz的频段研制了一款高温超导核磁共振接收模拟通路,其结构主
深度学习技术的飞速发展,催生出了一系列诸如计算机视觉,自然语言处理,强化学习之类的实际应用场景及方向,同时在安防监控领域也借助深度学习的发展迎来了技术手段上的变革。但是当前应用于安防监控领域的深度学习算法大多只停留在实验室阶段,虽然针对常用的数据集,当前的算法都能取得一个较好的精度,但在真实场景下,算法的精度和实时性能都不能达到实际应用的要求,所以急需一套智能化人体行为检测系统去解决当前真实场景下
字符识别是受到学术界和工业界重视的技术,需要根据针对性的场景设定和模型设计来解决相关实际问题。芯片字符识别作为字符识别的一种特殊场景,可以解决工业缺陷检测、自动化配装芯片等广泛性的工业问题。早期芯片字符识别方法,例如模板匹配等,只能在固定字体和固定场景发挥效果,但近年来随着深度学习算法的扩展和显卡浮点性能的增加,深度学习模型能够识别更多相似字体和更多场景的芯片,但深度学习模型的高精度基本建立在大量
移动边缘计算(Mobile Edge Computation,MEC)通过将计算资源部署到网络边缘,在地理上缩短了与用户的距离,可以就近处理用户的请求,避免了漫长的网络传输,从而提高服务的响应速度。由于边缘节点部署在网络边缘,单个节点的覆盖范围相对有限,因此用户的移动就有可能导致用户离开当前节点的覆盖范围而进入另外一个节点的覆盖范围。当用户从一个节点的覆盖范围进入另外一个节点的覆盖范围时,为了保证
本文以舰船、飞机等大型复杂装备电磁干扰现场检测为背景,把现场检测中的电磁干扰信号分类识别作为研究课题。针对大型装备面临的电磁干扰现场检测与故障模块查找问题,设计了一套EMI信号分类识别系统,构建大型装备电磁干扰现场检测案例库,进行EMI信号采集与特征分析、故障模块定位。首先,介绍了该系统应用场景、技术指标和软硬件构成,对系统中涉及的虚拟暗室、特征提取、模板匹配等相关技术进行了分析。其次,针对系统中
基于参量阵原理的屏幕定向扬声器是一种能够同时呈现画面和产生高度指向性可听声的新型屏幕扬声器,它利用超声波在介质中自解调产生定向可听声。由于介质的自解调过程是非线性的,受温度、湿度、信号处理算法和屏幕定向扬声器本身特性等多种因素的影响,导致屏幕定向扬声器解调出的可听声存在失真,对设备的音质有较大影响,因此本论文主要围绕屏幕定向扬声器的谐波失真进行研究,为便携式设备的屏幕定向扬声器实现高保真音质提供一