面向舰船知识领域的知识图谱构建关键技术研究

来源 :中国科学院大学(中国科学院人工智能学院) | 被引量 : 0次 | 上传用户:liyanxia8521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与传统的信息管理手段相比,知识图谱以其强大的语义处理与开放互联能力,可帮助人们迅速梳理目标知识之间的逻辑关系,对基于知识的智能推理实现有良好效果。与通用知识图谱相比,特定领域知识图谱以其知识的深度与完备性、数据模式的丰富和严格性以及描述的高准确性等优点,通常用于各种复杂的辅助分析或决策支持。本文在调研和分析了已有知识图谱构建关键技术的基础上,以构造舰船知识领域知识图谱为依托,对特定领域的知识图谱构建中命名实体识别、关系抽取以及知识融合等关键技术展开深入研究,本文的主要内容包括:(1)针对舰船知识领域命名实体存在嵌套以及长度过长等问题,提出基于字向量层叠模型的命名实体识别算法,首先通过高低层网络结构完成序列标注以及序列更正工作,最后利用条件随机场对上层输出序列标签进行校准并输出命名实体识别结果。实验表明本文所提出的基于字向量的层叠模型复杂命名实体识别取得了较好的效果,其F1值(F1值为加权调和平均值)达到了 87.93%。(2)针对舰船知识领域关系抽取中语料过少、深度神经网络无法学习高位数据特征等问题,根据该领域文本数据特点,本文提出了基于规则和触发词的混合关系抽取方法,对于半结构化文本数据采取基于规则的方式,利用正则模块与依存句法技术完成数据关系抽取工作。对于非结构化文本,采取基于触发词的抽取算法,将文本词汇与触发词词典中的词语进行匹配得到相对应的关系类型,最终实现五种以上实体关系的抽取,其抽取效果良好。(3)针对舰船知识领域中关系抽取的误差累计问题,本文将实体识别以及关系抽取模型进行融合,通过该实体-关系联合方法,实现原始语料到结果抽取的端到端学习,能够有效的减少误差累计的问题,为用户提供了很好的使用体验。(4)针对已抽取的知识存在严重冗余以及异构等问题,本文采用表示学习知识图谱的实体对齐算法来进行知识融合,即利用向量的相似度计算完成知识的融合,并采用Neo4j图数据库来完成存储。本论文通过对舰船知识领域知识图谱构建关键技术进行深入研究与改进,提高了命名实体识别和关系抽取的精准率以及F1值,并对图谱冗余知识进行实体对齐等知识融合工作,为构建高质量的领域知识图谱奠定了基础。
其他文献
知识产权战略的运用,使鞍钢由常规产品向高端产品转移、由同质化产品向差异化产品转变近几年来,鞍山钢铁集团贯彻落实科学发展观,转变经济增长方式,大力开展自主创新,培育核
进入21世纪以来,中央一号文件连续多年聚焦“三农”工作,习近平在党的十九大报告中首次明确提出要“坚定实施乡村振兴战略”。2018年2月4日,中央一号文件内容再度锁定“三农
我国是一个统一的多民族国家,历史文明的长河孕育出丰富多彩的民族节日。每个民族节日都具有其独特的文化价值,承载了各个民族的精神与情感,探索合适的数字化方式保护和传播
大湾煤矿被确定为瓦斯治理与综合利用工作体系示范矿井,作者结合大湾煤矿瓦斯治理工作体系实践,阐述了如何构建“通风可靠、抽采达标、监控有效、管理到位、隐患排除、综合利用
知识产权服务业是提供专利、商标、版权、地理标志、植物新品种等各类知识产权"获权—用权—维权"相关服务,促进智力成果权利化、商用化、产业化的新兴产业,是现代服务业的重要
船舶信息查询对于整个航运产业链发挥着至关重要的作用,也是许多船舶服务平台的基础功能。然而,传统的船舶信息查询往往只是机械地比对查询词和数据库数据之间的匹配关系,将
作为全球最受欢迎饮品——茶叶的故乡,中国完全有理由感到自豪。在世界最大产茶国及消费国的头衔旁落100年后,中国最近从印度手中夺回了这一历史地位。
立式推力滑动轴承系统是旋转机械设备最为关键部件之一,是机组正常发电和安全运行的重要保障。立式推力滑动轴承一般采用浸油自润滑方式,通过油-水冷却器带走热量,达到热平衡
日前,浙江省嘉兴市南湖区出台了《南湖区专利专项补助实施办法(试行)》。为规范专利补助机制,有效防止恶意套取专利补助资金的现象.实施细则完善了专利申请补助程序,该办法新增加了