【摘 要】
:
实体类型是知识图谱的重要组成部分,在知识图谱的应用中起到了重要的作用,但知识图谱中普遍存在实体类型缺失与不完全等质量问题。为了解决这个问题,通常采用机器学习分类方
论文部分内容阅读
实体类型是知识图谱的重要组成部分,在知识图谱的应用中起到了重要的作用,但知识图谱中普遍存在实体类型缺失与不完全等质量问题。为了解决这个问题,通常采用机器学习分类方法实现实体的类型预测,该类方法通过构造实体的特征生成数据集,训练以实体类型作为标签的分类器实现实体类型预测。目前基于分类的实体类型预测方法存在着一些局限性:分类器常为简单的单标签分类器、实体特征构造方法通用性差、输入特征为单一维度特征、未考虑知识图谱中类型的层次结构。针对这些不足,本文设计了一个基于多标签分类的知识图谱实体类型预测方法,能抽取实体的文本特征和链接特征,合理地利用这些特征进行分类,并考虑实体类型的层次结构。本文设计的方法主要包含三个阶段:在数据处理阶段,依照知识图谱文本信息和链接信息的不同,将其分为文本丰富型知识图谱和链接丰富型知识图谱,对于不同类型知识图谱采用不同的方法构造实体特征;在模型训练阶段,针对不同类型知识图谱特点设计了3个多标签分类模型,分别为:多标签文本分类模型TTPE、基于多特征的多标签分类模型MFTPE和层次多标签分类模型HTPE;在模型预测阶段,通过训练好的模型预测缺失和不完全的实体类型,并生成知识图谱的类型知识,从而补全缺失的类型信息。本文在单类型知识图谱SWCC、多类型知识图谱LinkedMDB、层次类型知识图谱AIFB和DBpedia上对方法的有效性进行了验证。此外,基于上述方法,本文实现了一个基于多标签分类的知识图谱实体类型预测系统。
其他文献
波长选择开关(WSS—Wavelength Selective Switch)是新一代可重构光分叉复用(ROADM—Reconfigurable Optical Add/Drop Multiplexer)光网络中的核心器件之一。基于硅基液晶(L
眼机交互是目前人机交互技术中具有前瞻性研究价值的新方向,目前已逐步应用在虚拟现实、残疾人辅助、医疗、教育和军事等诸多领域。近年来,越来越多的设备将眼机交互的方式加
当今,癌症是威胁人类生命的一大杀手。随着第二代测序技术的发展,产生了海量可用的基因表达数据。虽然,这类癌症数据包含丰富的基因表达信息,为科研工作者从分子水平揭露癌症
伴随现代计算机网络技术、通信技术的高速发展,如今船舶机舱模拟器的研制也日益更新,逐步完善。在当代轮机模拟器中,各项技术不断发展,利用创建三维模型,结合虚拟现实等技术,
本文开展了纳米流体燃料液滴在静电场中脱落及破碎特性的研究。采用微泵控制流量、高压静电发生器控制电压,采用氙灯光源进行透射照明、高速摄像仪采集图像等,搭建一套纳米流
步态识别是一种新兴的生物特征识别技术,与传统生物特征识别技术相比具有非接触性、远距离识别、难以伪装等优点,得到了广泛的关注与研究。但是在步态识别过程中的影响因素也
深度信息在车辆自动驾驶系统、机器人导航、三维重建等计算机视觉任务中发挥着非常重要的作用。立体匹配是一种经济便捷的从多个视图中获取深度信息的技术。高精度的匹配算法
基于属性签名,也称属性签名,能提供细粒度的访问控制,具有丰富的访问策略,且具有良好的隐私性,因而具有广泛的应用前景,是近年密码学研究的热点之一。指定证实者签名可以指定
管道运输在石油化工行业中发挥着重要作用,管道的质量检测是保障运输安全的必要手段,因此,管道的无损检测技术一直是研究的热点。传统的超声检测技术为单点检测,对于长距离管
观看三维(3D)立体显示时,许多人往往会感到视觉不舒适,视觉上的不适被认为是立体显示行业的头号健康问题。影响视觉舒适度的因素很多,也尚未有统一的立体显示视觉舒适度评价