论文部分内容阅读
行业数据是行业发展的基础和见证,高价值的行业数据可以帮助企业洞察客户、数字化运营、风险管控、精准营销、预测和决策等。虽然行业数据与日俱增,但企业往往苦于缺乏数据的应用场景,无法发挥数据的最大价值。随着人工智能技术的发展,越来越多的应用形态得以被挖掘。其中,智能问答是较为直接有效、低成本的数据获取与利用方式。但是,传统的智能问答技术往往基于问答对或知识库完成问题的识别与回答,问题形式较为单一,导致用户难以获得良好的交互体验,因此无法发挥行业数据的真实价值。本文的研究通过将知识图谱技术与智能问答技术进行结合,对多种问题形式的回答技术展开研究,提高各类型问题的识别率与回答准确率,探索依托行业数据的智能问答解决方案。本文主要在以下几个方面展开了研究工作: (1)通过行业知识图谱进行问答数据的存储与表示,研究了以智能问答为应用的行业知识图谱构建方法;提出了构建生命周期,包括行业知识建模,知识获取,知识融合以及知识存储四个主要步骤,并提出了基于词分布式表示的知识融合方法。 (2)结合行业数据特点对行业智能问答应用需求进行分析,研究以行业知识图谱为数据载体的问答系统实现技术,研究标准化的实现流程以及聚焦于行业的问题形式,实现了包括事实型、统计型、推理型、计算型问题在内的四类问题类型,并研究实体识别、意图识别到不同类型问题回答的实现方法。 (3)基于行业知识图谱的数据特点,对问答系统中的用户意图识别模块的实现技术开展研究。提出了基于行业知识图谱数据模式与图论算法的意图识别方法,研究基于知识图谱对上述四类问题的意图进行表示,并研究基于经典图论算法对用户问题的意图进行识别,发现问题中的主题、条件、附加信息等维度,为后续各类问题的查询构建提供铺垫。