区域科技企业知识图谱的构建与应用

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:JK0803_liuchao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为国家的重要战略资源,科技资源为科技活动提供了物质保障,为科技管理、决策和科学研究提供了基本性条件保障。科技资源在科技活动中的基础性作用逐渐被认识,并被赋予“第一资源”的历史地位。而企业不仅是科技资源的重要消费者,也是科技资源的重要组成部分。目前,中国中小型企业超过3000万家,个体工商户数量也超过7000万户。随着科学技术的不断发展,各企业普遍采用信息化技术进行科技资源管理,激增大量高质量的科技资源信息,但是这些科技资源由企业独立创建和维护,缺少整合共享,形成了大量分散、分离的“信息孤岛”,未能得到充分有效的利用。除了信息繁杂分散外,人们在利用企业信息时往往来自于个人的印象、他人的评价或对企业部分信息的解读,对于企业的全部信息无法有效利用。
  针对上述问题,本文完成如下工作:
  (1)构建京津冀科技企业知识图谱。首先使用京津冀科技企业数据,设计本体模型,进行格式标准化和数据清洗;接着利用爬虫获取额外企业信息,对原始数据进行信息补全,随后生成RDF三元组,完成企业知识图谱的构建;研究基于Jena的知识推理技术,对构建完成的知识图谱进行知识推理,并将推理出的内容补充到知识图谱中;最后采用Neo4J图数据库存储知识图谱,支持Cypher语句查询和查询结果可视化展示。
  (2)提出了基于Doc2Vec模型与HAKE模型的企业知识图谱嵌入表示方法。首先使用Doc2Vec模型对企业经营范围等描述信息进行嵌入表示,得到企业节点向量和文本的词向量;再利用HAKE模型对知识图谱进行表示学习,并将基于Doc2Vec模型的节点嵌入表示作为HAKE模型的预训练向量,得到知识图谱中各实体和关系的嵌入表示;最后通过对比实验,验证了所提出的方法可以有效提高企业信息检索的准确率。
  (3)构建区域科技企业信息检索系统。利用构建完成的知识图谱进行二次开发,采用SpringBoot框架为后台连接Neo4J数据库,将用户的检索信息转化为Cypher查询语句获取检索结果,将数据操作过程隐藏在后台,降低知识图谱的使用成本;使用D3.js完成结果的可视化表示便于用户理解。系统提供了用户管理、条件筛选、关键词检索和数据管理等功能,以满足用户对企业详细信息的检索需求。测试结果表明,知识图谱嵌入可以提高知识图谱的可用性,有助于深入挖掘节点内在的信息,为合理有效地利用科技企业资源提供了新的思路。
其他文献
本文首先讲述电力系统的发展及现代电力系统的特点,阐述了电力系统频率以及频率偏差的概念,研究了电力系统频率偏差对电力系统各方面的影响,从而说明了电力系统频率是电力系统运营的一个重要指标,及频率控制的重要性.然后介绍了低频减载的现状,并对传统法,半适应法和自适应法等减载方案分别进行了介绍和分析,指出这几种方案是建立在简单的单机系统基础上的减载方案,存在着不可克服的缺陷.论文对电力系统的频率特性进行了分
学位
认知无线电以频谱共享的方式提高通信系统的频谱利用率,是第五代移动通信系统(TheFifthGenerationMobileCommunicationSystem,5G)的关键技术之一。不同的认知无线电系统关注的系统性能有所不同:对于数据传输效率要求较高的系统,往往研究如何提高系统吞吐量;而对于节点能量受限的系统,往往研究如何提高系统能效。本文针对能量受限的认知无线电系统展开研究,重点研究顺序信道感
随着多媒体技术及Internet网络的迅速发展,图像信息资源的检索已成为国内外研究的热点。当今,基于内容的图像检索(CBIR)是该领域的重要研究方向。它不同于传统基于文本的图像检索,而是一种模糊查询技术,通过对图像提取一定的特征,找出在特征空间中与查询要求接近的图像,从而实现在图像数据库中自动地、智能地检索、查询和管理图像。在CBIR系统中,特征提取算法是决定图像检索结果的关键。目前对图像检索系统
学位
随着科技的日益发展,人工智能、大数据等新兴技术已经开始逐渐地走入人们的日常生活,智能家居产品也迅速地进入人们的视野。在传统的智能家居系统之中,视频监控中人体的行为识别主要依靠人工,这种方式必将给视频查看工作带来极大的工作量。针对这一问题,本文对人体行为识别技术进行了研究并将其应用到智能家居系统之中,以实现可以自动进行视频行为分类的功能,从而建立一款更加智能、便捷的智能家居系统。本文所做的主要工作包
学位
虚拟手术仿真系统在计算机上建立手术器械与组织模型,模拟出手术器械与组织的交互场景,可以用于手术培训和指导、手术方案制定和优化、手术导航等。在虚拟手术仿真系统中,手术器械与软组织交互是难点。首先需要建立组织器官准确的几何模型。其次对软组织的触压、提拉、切割、缝合、抽吸等各种类型的手术操作都是以软组织形变作为基础。软组织的虚拟手术仿真系统的核心是形变模型,构建一个准确且能实时处理的软组织形变模型一直是
学位
随着对模糊系统理论研究的不断完善与深入,模糊系统已经被成功地应用于诸如分类、控制、信号处理以及决策支持等很多领域。利用模糊系统作为一种处理实际问题的新兴手段,其目的不是在于激化模糊的概念,而是在于让模糊的概念具备清楚的描述方法,从而达到简化问题的目的。模糊系统已经被证明是全局逼近器,因此只要模糊系统足够复杂,那么通常其性能是足够令人满意的,但对模糊系统过于复杂的设计却不利于实际应用。  可解释性无
学位
随着全球变暖趋势加剧,水文与气象生态的变化愈加强烈,导致全球水旱灾害发生频率增加、强度加重,对人类社会和生态环境造成的负面影响愈加严重。本文以河南省作为研究区域,使用记载水旱灾害的史料文本数据,运用文本分析与自然语言处理(NLP)等方法,分析了河南省水旱灾害时间跨度长达近四千年的时间规律、河南省县级维度下的空间规律,并构建水旱灾害风险评估模型与指标体系,得到河南省地级维度水旱灾害风险等级。主要研究
近年来,应用程序更多的以云服务方式部署,用户通过浏览器等途径通过网络访问云服务。这种方式在增加服务便捷性和开放性的同时也带来了性能和可用性方面的不确定性。负载测试是评估应用程序性能的重要手段,能有效预防性能风险,保障云服务质量。传统的负载测试多基于本地集群方式实现,由多台本地主机相互配合发起服务访问请求,完成测试任务。这种方式需要专业技术人员管理和维护测试主机,主机运行和维护代价较高;并且硬件资源
学位
随着“工业4.0”和“中国制造2025”的提出,我国制造业不断创新发展,同时伴随汽车保有量的增加,售后服务市场所面对的用户群体也越来越大。服务商作为下游直接接触客户的企业角色,却没有综合利用多个价值链中的海量数据进行分析,从中发掘更多有价值的信息,通过数据智能的方式为自身或其它企业提供服务。对此,论文基于第三方云服务平台,结合服务商的实际需求,对多价值链下的售后数据服务技术进行了研究,并完成了系统
学位