论文部分内容阅读
企业客服服务的质量会直接影响客户对公司产品的满意度。随着互联网用户的爆炸式增长,传统人工客服难以应对庞大的用户量,并且无法24小时解决问题。人工客服的效率也无法保证,并且传统人工客服需要消耗大量的人力、财力。因此使用智能问答系统代替或者辅助人工客服可以大大降低成本,提高效率。智能问答系统从应用领域可以分为开放域问答系统和封闭域问答系统。从技术层面可以分为:基于检索(答案选择排序)的问答系统,基于本体库或者知识图谱的问答系统,基于深度学习模型的生成式问答系统。本文使用两种问答系统解决方案,分别是FAQ问答方案和本体问答方案,实现面向地产领域的智能客服问答系统。本文主要的研究内容如下:(1)本文提出一种多元特征融合+命名实体识别的问题分类方法。在FAQ问答和本体问答两种方案选择时,本文使用问题分类的方法作为调度两种方案的重要依据。命名实体识别采用LSTM+CRF的方法。文本分类采用多元特征融合模型的方法,通过命名实体识别的结果对文本分类的预测概率进行加权修正。通过实验证明多元特征融合+命名实体的问题分类方法比单一的深度学习文本分类的模型效果要好。(2)本文在Matchpyramid模型和BIMPM模型的基础上提出一种改进的语义相似度计算模型。在FAQ方案中,语义相似度计算是核心内容。最近几年随着深度学习的迅猛发展,基于深度学习模型的语义相似度计算方法在效果上几乎已经碾压传统NLP方法。本文使用改进的深度学习模型来完成语义相似度计算任务,并通过实验证明该模型的在测试集上的表现要比Matchpyramid模型和BIMPM模型要好。(3)本文同时采用FAQ问答和本体问答两种方案。因为FAQ问答技术也就是基于检索的方案只能从现有的答案当中抽取答案,对于一些地产信息的问题并不能完全覆盖,所以引入本体问答方案。本体问答方案是对FAQ方案的补充。在本体问答方案中,依照分词之后的语料对本体库进行手工构建。对问句进行关键字匹配和命名实体识别,利用其结果构造SPARQL表达式,完成对于本体库的检索,进而获得用户的回答。并基于FAQ问答和本体问答两种方案,设计一个完整的面向地产领域的问答系统。