基于深度学习的客服问题相似度识别

来源 :中国民航大学 | 被引量 : 0次 | 上传用户:liuyumingming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的不断发展与普及,传统的客服越来越不能满足当前的业务需求,基于语言技术的智能客服系统应运而生。在智能客服问答系统中,用户的问题具有咨询意图复杂、上下文相关性弱、问题多样、指代缺失、口语化严重等问题,造成智能客服在计算问句相似度的准确率不高,容易出现答非所问的情况。基于词匹配相似度计算,只从单个词的字面意思考虑,忽略了文本的语义信息。基于词向量相似度的方法虽然可以有效表达词汇之间的语义关系,但忽略了两个句子在特定语义环境下的相互作用。为了解决上述问题,本文提出了将深度学习中的一些模型引入到智能客服问题相似度识别中来。首先,本文提出基于多交互注意力卷积神经网络MA-CNN(Multi-Attention-CNN)。MA-CNN通过两个不同位置的注意力机制,综合考虑了两个句子间的词语层次、句子级别的深层语义信息,帮助智能客服多层次、多角度、多粒度地理解用户的问题。从而改善了基于词向量的相似度计算方法只关注了句子间词语之间的关系,而忽略了不同句子间整体的语义联系的问题。其次,在交互注意力机制的研究基础上,本文提出一种基于双向多注意力多循环神经网络BMA-GRU(Bilateral Multi-Attention-GRU)模型。卷积神经网络只能获取单向的文本信息,无法从正向逆向两个角度描述文本信息,BMA-GRU使用双向GRU可以从双向进行文本表示,卷积神经网络没有记忆性,语序不会对卷积神经网络产生影响,而使用GRU加入了文本的前后顺序性与记忆性,使得文本表示更合理。在MA-CNN只有交互注意力,无法提取每句话中有用的信息,而BMA-GRU可以对每句话中不同的语义信息有不同的权重,这样可以更好地理解文本。最后将两种模型与基于词向量的传统模型及其他深度模型作对比实验,结果表明本文模型的合理性、有效性。
其他文献
目的 研究microRNA-155(miR-155)对高转移性人食管癌EC109细胞增殖和侵袭等生物学行为的影响.方法 以人食管癌EC109基因组DNA为模板,经PCR法扩增miR-155的前体序列,通过BamHⅠ
主动权是一种精神状态和工作状态,有主动权干起工作来就感到“顺”:没有主动权,处处被动应付,就会感到焦头烂额、心力交瘁。对于领导者和领导工作来说,主动权是至关重要的。在革命
对涪麦冬[Ophiopogon.japonicus(L.f.) Ker-Gawl.cv.Fumaidong]连续两年内干物质积累与分配规律进行研究.结果表明,叶片积累干物质集中在4~11月,营养根与块根大量积累干物质在10
高一学生学习心理调查张维萍杨正平谭春梅为了解和掌握学生的学习心理,我们于1995年3~4月分别对南宁三中、南宁沛鸿中学、南宁第四职业中学的在校高中一年级学生进行了调查。1对象与方
本文结合有关调查数据分析了民办高校图书馆馆藏资源建设的特点和存在的问题,并针对存在的问题提出了有关建议和措施。 Based on the survey data, this paper analyzes the
在碱处理ZSM-5的浆液中外加模板剂和新的硅铝源,采用水热合成法合成了具有微孔和介孔孔道的多级孔道H-ZSM-5/MCM-41分子筛,采用XRD、BET和HRTEM等方法对其表征。在2.0 MPa、3
通过对政务服务大数据报告的生成过程,做出技术上的分析说明。
植被含水量(VWC)能够指示植被的水分状况,对植被生长、火灾、旱灾以及生态环境安全监测等具有重要意义,也是微波遥感估算土壤水分的重要参数之一。光谱指数法是估算植被含水
在旅游业发展的进程中,需要有各种利益相关者的参与。而促使旅游可持续发展是所有旅游利益相关者的责任。对现有的利益相关者角色进行分析,了解不同利益相关者的参与动机,是
近年来,我国网络新闻传播中涌现出一个特殊群体——"标题党",他们为博取受众眼球,大肆制作耸人听闻、题文不符的新闻标题。[1]本文针对微信中的"标题党"现象及给受众带来的危害做