基于语句相似度计算的FAQ问答系统设计

来源 :浙江大学 | 被引量 : 0次 | 上传用户:litian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今互联网行业飞速发展,人工智能引领的科技浪潮正在把人类社会从互联网2.0时代推向互联网3.0时代。在全新互联网3.0时代提出的设想和建设中,互联网将理解用户需求并为之提供服务。互联网会对用户数据了如指掌,知道用户有什么、想要什么以及用户的行为习惯,并依据数据进行资源筛选匹配,直接给用户提供服务。如此一来,人们从互联网寻求问题答案、信息知识时,交流途径将变得越来越多样化。从传统的搜索引擎时代,演变到用户与用户之间交互式的问答知识社区时代,一步一步走向基于大量知识语料训练得到的问答机器人时代。传统搜索引擎对知识和答案的检索是一种纯粹的关键词查询方案,通过这种渠道检索到的问题答案往往没有针对性,不能准确理解用户检索、询问意图,且检索结果以网页相关信息列表呈现,包含大量无用信息,导致难以快速定位结果的问题;用户之间交互式的问答社区虽然部分消除了通过机器进行语义理解的环节,但同时又产生了时效性问题,同时需要人为干预以保证社区答案知识的准确性;通过语料知识训练的智能问答机器人既能在一定程度上理解用户检索问题的语义,又能保证回答的即时性和准确性,它将会成信息检索、自动问答领域中更高效、更便捷、更及时、更准确的解决方案。本文以浙江汇信科技有限公司数字证书问答客服系统科研项目为背景,设计并实现了基于语句相似度计算的FAQ问答。主要实现了包括问答知识库梳理、语言模型设计与实现、问答接口设计与实现等主要功能,项目涉及到文本检索、分词、词向量、语言模型、深度神经网络、RestfulAPI、Gunicorn/Gevent等关键技术。通过浙江汇信科技有限公司的内部对接评测,该项目开发的智能问答客服机器人最终准确率达到83.75%,达到FAQ问答行业相似水平,远高于其原有基于关键字检索的问答检索方案。目前该算法模型及接口已成功通过各项测试,正在部署系统服务,做最后的上线准备。
其他文献
本文根据《企业会计准则》、《企业财务通则》及现行行业财会制度,概述了材料计价、折旧及坏帐损失处理等不同的会计政策,以及对同一经济事项的处理选用不同的会计政策所产生的
目的观察清热化湿祛瘀中药清肾颗粒对慢性肾衰竭(CRF)湿热证患者血清瘦素(Leptin)、Janus激酶/信号转导与转录活化因子(JAK/STAT)信号通路中Janus激酶2(JAK2)蛋白及信号转导
随着我国社会经济的发展,科学技术的不断进步,流媒体技术的出现是必然趋势,该类技术使人在网上进行在线实时的直播成为了现实,丰富了人们的日常生活。因此本文主要研究了流媒
随着时代的发展,科技的进步,对劳动者综合素质的要求越来越高。培养技能过硬、心理健康的劳动者,已经受到社会越来越广泛的关注。单纯地进行传统心理健康教学,其形式是单一的
本文通过对NY/T 761-2008《蔬菜和水果中有机磷、有机氯、拟除虫菊酯和氨基甲酸酯类农药多残留的测定》等标准进行改进,探索实验出了一系列适食用菌子实体鲜样和干样、栽培料
目的本研究旨在观察疏肝理气,运脾和胃法治疗功能性消化不良肝胃不和证的临床疗效。方法采用疏肝运脾和胃方加减治疗功能性消化不良70例,与70例口服枸橼酸莫沙比利、奥美拉唑
随着计算机及网络技术的飞速发展,Internet, Intranet的应用在全球范围内日益普及,计算机作为知识经济时代的产物,已被广泛应用于社会各个行业和领域。当今社会正快速向信息
目的:观察参附益心颗粒治疗冠心病心力衰竭(气虚阳虚兼血瘀水阻证)的有效性与安全性,并进一步研究其作用特点。方法:采取随机、双盲、对照的方法,将48例冠心病心力衰竭(气虚