基于事实信息融合的知识图谱补全方法研究与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:wjw909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱是一种结构化的语义知识库,它通过符号形式描述客观世界中的概念及其相互关系。目前,知识图谱在知识问答、智能推荐等众多场景中得到了广泛应用,是人工智能领域中的重要研究内容。然而,现有知识图谱面临着稀疏性和不完整性的问题,这会严重影响知识图谱在应用中的效果,因此知识图谱补全成为了学术界和工业界的热点问题。知识图谱补全旨在找到现实世界中应该存在但在知识图谱中缺失的事实,提高知识图谱的完整性。现有的知识图谱补全方法主要是通过将知识图谱中的实体和关系嵌入到低维稠密向量空间中,并通过计算实体和关系在向量空间中的距离或相似度来判断它们之间是否存在一定联系,从而实现知识图谱补全。然而,现有方法存在着一些不足:一方面,它们主要关注在实体和关系本身而未考虑事实上下文,无法更好地学习到实体和关系在不同事实下的语义信息;另一方面,负采样是知识图谱补全过程中重要步骤,现有的负采样策略主要通过随机替换事实中的头实体或尾实体的方式来生成负样本,这往往会导致所生成的负样本质量不高,影响知识图谱补全的效果。本文针对上述问题进行了深入的研究,主要工作如下:(1)提出了一种融合事实信息的知识图谱补全模型,该模型由事实信息编码器和事实信息融合模块两部分构成。其中,事实信息编码器通过门控循环单元(Gated Recurrent Unit,GRU)捕获实体和关系的序列依赖关系,并利用卷积神经网络(Convolutional Neural Network,CNN)进行局部特征提取;事实信息融合模块使用深度神经网络将事实信息的嵌入表示融合到实体和关系中,从而使实体和关系获得对应的事实语义,增强了实体和关系的表达能力。(2)提出了一种基于预训练评估模型的负采样优化方法,该方法包括评估模型的预训练和负样本候选集生成两部分。其中,评估模型是由三元嵌入矩阵组(Triple Embedding Matrix Pair,TEMP)和深度神经网络构成,通过预训练的方式使评估模型实现对负样本合理性的评估;随后,采用负样本候选集生成方法来过滤掉与正样本语义相差过大的负样本。使用该负采样策略可以生成高质量的负样本,从而提高知识图谱补全模型的性能。(3)设计并实现了一个面向软件开发领域的知识图谱补全系统(Software Knowledge Graph Completion System,SOFT-KGCS)。该系统能够实现软件开发知识的获取、融合及补全,增强了软件开发知识图谱的完备性,为软件开发人员提供高质量的领域知识,提高了软件开发知识图谱的利用效率。最后,本文在多个真实数据集中对所提出的知识图谱补全模型和负采样优化策略进行了实验验证。实验结果表明,与现有的知识图谱补全模型和负采样方法相比,本文提出的模型均取得了较好的实验结果。
其他文献
铝合金被广泛地应用在航空航天、高速列车和汽车工业等领域。为了获得高性能的细晶结构材料,进而拓宽铝合金材料的工程应用范围。本文采用熔铸工艺制备低Zn含量Al-Zn-Mg-Cu(7xxx)合金、含Sc低Zn 7xxx铝合金、高Zn 7xxx铝合金和含Sc高Zn 7xxx铝合金四种合金铸锭,并对铸锭进行均匀化热处理、热轧、固溶时效热处理、搅拌摩擦加工(FSP)以及加工后轧制与热处理。采用光学显微镜、透射
大数据审计是指审计机关遵循大数据理念,运用大数据技术方法和工具,利用数量巨大、来源分散、格式多样的经济社会运行数据,开展跨层级、跨地域、跨系统、跨部门和跨业务的深入挖掘与分析,提升审计发现问题、评价判断、宏观分析的能力。与传统审计相比较,大数据审计所使用的数据更多源异构,使用的技术方法更复杂高级,对数据的洞察更敏锐深刻。
在社会高速发展的今天,健康的经济体系对能源工业特别是电力工业提出了越来越高的要求,P91钢是我国新一代的耐热钢,以其良好的性能被广泛的用于各类电站机组上,电站机组的运行环境十分恶劣,安全需求高,一种针对P91钢微观损伤的快速无损检测方法十分重要。非线性超声检测技术是一种对材料微观损伤十分敏感的无损检测技术,因此本文利用非线性超声检测平台对P91钢材料的微观损伤进行了检测研究。具体研究内容分为以下三
本论文围绕隐马氏模型中的参数估计问题展开讨论,首先我们根据隐马氏模型中的两个随机过程的关系,把它们联合在一起考虑它们的联合过程,我们知道该过程是一个马尔可夫过程。然后对联合过程的转移概率核展开研究,我们根据过程的取值空间的不同,引入了隐状态空间和联合过程空间上的转移概率核,研究中发现在联合空间上的转移概率核包含了在一般的隐马氏模型的参数估计中的所有类似的三组参数(转移概率,观测概率和初始概率),因
路面混凝土,具有收缩小、早期强度高且耐久性良好等特点而广泛应用于城市道路、机场跑道等需要快速修补的工程以及海港码头、桥梁隧道等快速抢修抢建工程。传统的制作方法是采用道路水泥或特殊工艺,配制的路面混凝土通常早期强度低、收缩开裂严重,而且配制成本昂贵、工艺复杂。本课题旨在采用常规原材料及普通工艺,研制出低收缩高早强路面混凝土。本文依托茂名市普通国省道干线公路路面改造工程项目,针对桂东南丘陵山区地带亚热
本文利用数值方法研究了强激光照射超声速导弹,弹体材料发生气化时,喷流蒸气对流场以及弹体气动特性的影响。利用有限体积法,空间离散采用具有TVD性质的NND格式,时间离散对定常问题采用LU-SGS格式离散,非定常问题采用二阶显式Runge-Kutta型格式,求解全流场NS方程,同时考虑了真实气体模型以及B-L代数湍流模型;应用克努森层理论,并且考虑材料表面的反射效应,研究了存在环境气体时激光气化材料蒸
近年来,随着无线通信频率的不断提高,信号延迟现象变得更加明显,系统损耗和发热量也随之增大,系统稳定性逐渐变差,因此,对制造谐振器、滤波器和介质基板等通信元器件的关键基础材料——微波介质陶瓷的性能参数(相对介电常数εr、品质因数Q×f以及谐振频率温度系数τf)提出了更高的要求。目前,系列通式为A2BO4的Mg2Si O4、Ca MgGeO4等橄榄石型陶瓷和Zn2Si O4、Zn2Ge O4等硅锌矿型
我国作为世界第二大经济体,2019年GDP达到99万亿,但第三产业对经济的贡献度仅有53.9%,而作为世界前五经济体的日本、德国和英国,其第三产业占比可达71%以上,对比来看我国第三产业仍存在很大的发展潜力。信贷政策在产业政策调整和产业结构升级中扮演重要地位,但我国信贷供给效率如何呢?在不同经济发展水平的地区,信贷供给增加是否会同一性的促进第三产业发展和产业结构升级等问题并无定论,因此,探究信贷供
微波介质陶瓷是现代通信技术中的关键基础材料,它们可以广泛地用来制备各种滤波器、谐振器、天线等微波电子元器件。随着我国现代移动通讯不断朝着低成本、高品质方向前进,对于微波介质陶瓷产品的生产成本与其性能也提出了新得更高标准。稀土基陶瓷材料其具有优异的品质因数,一直受着许多研究者们的密切关注。本文对几种新型稀土基微波介质陶瓷材料分别对其进行了物相结构、微观形貌以及介电性能研究。(1)采用固相反应法成功合
隐马氏模型(Hidden Markov Model,HMM)是一个不完全统计模型,其经典理论由Baum等人在20世纪60年代末给出.它是过去四十年中最成功的统计模型之一,在语音识别、异常检测、生物统计等领域中有广泛的应用.从理论上来说,HMM需要解决三个问题:识别问题、隐状态估计问题和参数估计问题.三个问题通常都是不可分割的,在实际应用时只有侧重点的不同,对这三个问题的回答构成了HMM的理论基础.