论文部分内容阅读
随着互联网信息技术的发展,基于传统搜索引擎的信息获取方式,已经很难满足人们知识获取的需求,而智能问答系统就应运而生。不同于传统搜索引擎,智能问答系统利用自然语言处理技术,获取答案,再直接返回给用户,提高了搜索效率。与此同时,近年来知识图谱发展迅速,为智能问答系统的升级提供了一种技术手段,使得问答系统的工作方式更接近于人类的思维方式。论文以一家耕耘于政府采购领域多年并实现了采购全过程、全时段、全领域的电子化系统平台的对话问答服务需求作为研究背景,展开课题研究工作。论文工作主要包括在问答服务中,引入政府采购知识图谱技术,并与自然语言处理技术、深度学习方法相结合,实现了政府采购智能问答服务。论文主要研究内容包括以下四个方面:(1)问答服务问题综述。立足于所选择企业的现实需要,分析了基于知识图谱的政府采购问答系统面临的问题,探讨了相关技术与算法。(2)构建面向政府采购封闭领域的知识图谱。论文提出了一种面向政府采购领域的知识图谱构建方法。(1)论文借鉴斯坦福提出的七步法对处于构建流程最上层的知识模式进行定义。(2)针对知识抽取任务,论文提出了一种基于Bi GRU的流水线抽取模型:先使用基于字词混合向量的Bi GRU-CRF模型抽取实体;后利用关系分类模型Bi GRU-Attention,获得实体之间的关系;最后形成知识图谱最小单位-三元组。(3)针对知识融合任务,论文使用Word2vec模型,以计算词间的空间距离方法,完成了词间语义相似度的度量。通过设置相似度阈值,完成实体间关系的分割,以完成实体对齐的需要。(4)针对知识更新与存储,引入专家经验、知识,通过数据层的更新以及人工复检提升知识图谱质量,将更新及审核过的内容存入neo4j图数据库。(3)完成用户问句分析与答案检索。论文研究并应用基于知识图谱的政府采购问句分类与答案检索技术:(1)使用实体抽取模型,识别出问句实体;(2)将问句实体与知识图谱中对应的实体链接;(3)基于Text CNN-Attention的问句分类模型识别问句意图,解析自然语言问题,将自然语言问句转换为用于在Neo4j中查询的Cypher语句;(4)借助Cypher查询技术,在图数据库中搜索并推送答案。(4)设计并实现基于知识图谱的政府采购智能问答系统。以html+query为前端框架,python+Sanic为后端框架,使用python语言,基于论文研究结果,开发了政府采购问答系统软件,按照软件工程方法,对软件进行测试,测试结果证明实现了课题设计目标。