知识图谱构建技术综述

来源 :计算机工程 | 被引量 : 0次 | 上传用户:yczcjlk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱在医疗、金融、农业等领域得到快速发展与广泛应用,其可以高效整合海量数据的有效信息,为实现语义智能化搜索以及知识互联打下基础.随着深度学习的发展,传统基于规则和模板的知识图谱构建技术已经逐渐被深度学习所替代.梳理知识抽取、知识融合、知识推理3类知识图谱构建技术的发展历程,重点分析基于卷积神经网络、循环神经网络等深度学习的知识图谱构建方法,并归纳现有方法的优劣性与发展思路.此外,深度学习虽然在自然语言处理、计算机视觉等领域取得了较大成果,但自身存在依赖大规模样本、缺乏推理性与可解释性等缺陷,限制了其进一步发展.为此,对知识图谱应用于深度学习以改善深度学习自身缺陷的相关方法进行整理,分析深度学习的可解释性、指导性以及因果推理性,归纳知识图谱的优势以及发展的必要性.在此基础上,对知识图谱构建技术以及知识图谱应用于深度学习所面临的困难和挑战进行梳理和分析,并对该领域的发展前景加以展望.
其他文献
随机森林在bootstrap的基础上通过对特征进行抽样构建决策树,以牺牲决策树准确性的方式来降低决策树间的相关性,从而提高预测的准确性.但在数据规模较大时,决策树间的相关性仍然较高,导致随机森林的性能表现不佳.为解决该问题,提出一种基于袋外预测的改进算法,通过提高决策树的准确性来提升随机森林的预测性能.将随机森林的袋外预测与原特征相结合并重新训练随机森林,以有效降低决策树的VC-dimension、经验风险、泛化风险并提高其准确性,最终提升随机森林的预测性能.然而,决策树准确性的提高会使决策树间的预测趋于
针对建筑物混凝土腐蚀检测中传感器单一且常规卡尔曼滤波算法容易出现滤波精度降低的问题,提出了一种多传感器综合检测方法.采用改进的自适应卡尔曼滤波算法,利用最大概似估计准则,将新息方差直接引入卡尔曼滤波器的增益计算,实现估计模型的动态调整,降低了系统噪声和测量噪声的干扰.最后,对自适应卡尔曼滤波和常规卡尔曼滤波算法进行了仿真对比实验,结果表明,自适应卡尔曼滤波算法有效提高了多传感器信号检测的精度和稳定性,性能优于常规卡尔曼滤波算法.
针对过程数据的多模态和非线性的特征,提出了改进的局部近邻标准化和PPA结合的过程故障检测方法.首先寻找每个样本的第一近邻样本,再寻找第一近邻样本的局部前k近邻集,用近邻集的均值和标准差进行数据标准化,最后使用主多项式分析(PPA)对标准化处理后的数据建模,计算T2和SPE统计量,并确定控制限进行故障检测.主多项式分析使用一组灵活的主多项式分量来描述数据能够有效地捕捉过程数据中潜在的非线性结构,ILNS方法能够将多模态数据融合为单模态数据,消除过程数据的多模态特征使PPA算法的建模更加精确.最后通过多模态非
为了改善在远程共享时,易出现的实时性差以及数据信息安全性能低问题,提出一种基于粒子群优化的数据库信息远程共享方案.根据网络实时环境及数据库信息特征整理,构建整体远程共享构架,使用粒子群优化法计算数据库信息中目标函数,将待实现优化的数据库作为粒子,实施初始化参数操作,并采取分组形式实现粒子运动位置的实时更新,再将最优粒子替换较差粒子,直到全部信息符合共享条件,最优信息经过数字转换机制实现格式转换,输入到具有兴趣约束的远程共享平台中,完成信息的远程共享.仿真结果证明,所提方法可实施性强且共享整体效率较高,有效
针对传统方法数据修复率较低,修复耗时较长,修复准确性较低的问题,为提高通信网络链路非平稳数据修复效果,设计了一种通信网络链路非平稳数据自动修复方法.采集通信网络链路传输数据,并构建非平稳数据噪声模型,对采集的数据进行去除噪声处理.根据噪声处理结果采用遗传算法对非平稳数据进行检测,并采用决策树方法对非平稳数据进行自动修复.实验结果表明,所设计方法的数据修复准确性较高,非平稳数据自动修复率较高,并且修复耗时少,证明了所研究的修复方法提高了非平稳数据的修复效果,具备实际应用意义.
目前多数文本分类方法无法有效反映句子中不同单词的重要程度,且在神经网络训练过程中获得的词向量忽略了汉字本身的结构信息.构建一种GRU-ATT-Capsule混合模型,并结合CW2Vec模型训练中文词向量.对文本数据进行预处理,使用传统的词向量方法训练的词向量作为模型的第1种输入,通过CW2Vec模型训练得到的包含汉字笔画特征的中文词向量作为第2种输入,完成文本表示.利用门控循环单元分别提取2种不同输入的上下文特征并结合注意力机制学习文本中单词的重要性,将2种不同输入提取出的上下文特征进行融合,通过胶囊网络
吞吐量的准确预测对于港口的发展具有重要意义,传统的单一模型在预测的精度或稳定性上都存在局限性.为提高吞吐量预测精度,引入Stacking算法的思想建立组合模型,并在此基础上提出了利用PCA-BP模型修正Stacking算法误差的误差修正模型;同时以1998-2017年深圳港集装箱吞吐量为实证研究对象,进行了基于BP神经网络和NARX神经网络单一预测模型、误差修正Stacking算法的预测模型及其它组合模型的预测对比分析,结果显示误差修正Stacking算法模型预测精准度最好,验证了模型的可行性,为港口的吞
传统的数据挖掘算法在面向大规模高维数据的挖掘过程中,存在数据特征捕捉准确率低、节点负载不均衡、数据交互频繁、频繁项集紧凑化程度低等问题.提出基于MapReduce的并行挖掘算法PARDG-MR,结合高维数据特征,设计基于维度粒化算法和负载均衡算法的DGPL策略,并对数据进行预处理,以解决高维复杂数据特征属性捕捉困难及数据划分中节点负载不均衡的问题.通过构建基于PJPFP-Tree树的频繁项集并行挖掘策略PARM,实现频繁项集的并行化分组过程,从而提高数据处理的运行效率.在此基础上,提出基于剪枝前缀推论的整
实体对齐表示在不同的知识图谱中查找引用相同现实身份的实体.目前主流的基于图嵌入的实体对齐方法中的对齐实体通常具有相似的属性,有效利用属性信息可提升实体对齐效果,同时由于不同知识图谱之间的知识分布差异,仅考虑单个方向的对齐预测会导致预测结果出现偏差.针对上述问题,提出一种改进的跨语言实体对齐方法.利用融合属性信息的双向对齐图卷积网络模型,将前馈神经网络编码实体对应的属性信息与初始的实体嵌入相结合,得到联合属性信息的实体表示,并使用双向对齐机制实现跨语言的实体对齐预测.在3个跨语言数据集上的实验结果表明,该方
以降低软件高速缓存侧信道对用户的危害指数,提升软件的防御能力为目的,研究移动终端软件高速缓存侧信道脆弱性识别方法.通过信号渗透率挖掘脆弱点,转换数据流脆弱点为网络关键节点,以节点度为依据,利用判决门限保持虚景概念和漏检概念平衡.通过筛选节点挖掘缓存侧信道脆弱点,比较其可能存在的不同缓存访问地址,根据脆弱点的可利用性,实现移动终软件高速缓存侧信道脆弱性的识别判断.仿真结果表明,上述方法具备较强的脆弱点识别能力,检测出脆弱点数量较多,同时具备较强的信号抗干扰能力及识别效率,可有效提升信号响应性能和脆弱点识别能