论文部分内容阅读
随着智能设备的普及和互联网的高速发展,网络上的数据呈爆炸式增长,并且数据背后存在着大量离散信息以及复杂关系。为了能够高效的利用网络数据,国内外的企业和研究机构纷纷构建特定领域的知识图谱服务于未来智能生活工作场景。知识图谱能够打破传统数据存储媒介的局限,让原本相对孤立、离散的多源异构数据形成统一的网络结构,为智能问答、智能搜索和推荐等应用提供底层数据和技术支持。我国政府一直致力于解决存在的贫困问题,但由于各地政府的扶贫基础数据存储相对独立且结构不尽相同,不易实现数据的互通共享,因此国家难以制定精准有效的扶贫策略来解决贫困难题。知识图谱技术的出现为这一难题提供了新的解决思路。目前国内针对扶贫领域知识图谱的研究工作十分匮乏,为此,本文针对政府扶贫数据开展了扶贫领域知识图谱的构建及应用研究工作,对知识抽取、数据融合和系统构建及应用等方面的具体操作进行了详细阐述,这对充分利用扶贫领域数据提供了极大地帮助。本文研究扶贫领域知识图谱的构建方法及应用系统的实现,希望通过将知识图谱技术应用到扶贫领域,从而实现政府开放数据的高效利用,服务于精准扶贫的需求。首先,对政府扶贫数据集进行数据分析和整理,分析后提取其中主要的类、对象及其属性,构建扶贫领域本体作为知识图谱的上层数据规范。然后,依据构建的本体用数据集成工具Karma将原始数据进行概念和数据之间的语义映射,集成后发布成统一的RDF三元组数据。针对数据集中的无结构文本数据,主要使用自然语言处理中的实体识别和关系抽取技术,利用深度神经网络算法解决了对无结构化文本中人物关系三元组数据的抽取。将抽取到的三元组信息进行融合和解析后,根据知识图谱中三元组数据的特点,采用基于图结构的Neo4j图形数据库作为数据存储方案。最后,基于构建的知识图谱设计开发了扶贫知识图谱应用系统,实现了数据检索和智能问答等功能。本文从政府扶贫数据出发,通过构建知识图谱解决了各数据源之间孤立且结构不统一的问题。同时将整合后的数据存储在Neo4j图数据中克服了传统数据库对多层深度查询能力不足的缺点。基于此方法设计的知识图谱,极大地节省了整合多源异构数据及知识图谱构建的时间,提高了用户获取精准信息的速度,对于满足政府精准扶贫等需求具有重要意义。