噪声敏感的关系感知跨语言实体对齐方法研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:wcd_soft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱是一种用图来描述知识的技术方法,在表示从不同领域收集的知识方面起着至关重要的作用。然而,不同的知识图谱通常由不同的技术或不同的语言构造,这些单独构建的知识图谱之间包含异构但互补的内容,因此将不同来源或不同语言的知识图谱整合为统一的知识图谱很有意义,一种有效的对齐知识图谱的方法是把多个不同来源但代表相同对象的实体进行对齐。在大数据时代的背景下,为了实现知识的全球共享,跨语言实体对齐作用愈加明显。双语词典是跨语言自然语言处理中一项非常重要的资源,对跨语言实体对齐任务有着奠基的作用。本文以中英文两种语言为例,提出了一种基于百科语料的中英文双语词典的提取方法。方法是在对文本内容提取的基础上结合在线百科的结构特点,分别用五种不同的方法对百科语料进行提取,与以往的基于部分双语语料的提取方法相比,本方法在在线百科语料上的提取数量提高了170.75%。目前实现跨语言实体对齐方法主要是基于知识图谱表示学习以及图卷积网络(Graph Convolutional Networks,GCN)方法,前者学习知识在不同知识图谱中的向量表示,并通过计算不同知识图谱中向量的相似度来对齐实体,但这种方法对知识图谱中大量存在的复杂的关系的获取比较困难,而后者则更容易获取复杂的关系。然而以上两种方法的训练集通常是人工标注的预对齐的实体对,可能包含噪声,这会影响最终的对齐结果。因此本文提出了一种噪声敏感的关系感知双图卷积网络模型(Noise Sensitive Relation Aware Dual Graph Convolution Network,NSRDGCN),模型解决了关系感知类的跨语言实体对齐模型对数据集要求更高的问题,提高鲁棒性。模型由两部分组成,分别是关系感知跨语言实体对齐模块和噪声检测模块,其中噪声检测模块利用生成式对抗网络(Generative Adversarial Network,GAN)来检测训练集中的噪声,生成器生成噪声,而判别器鉴别噪声与真实数据,二者进行对抗训练;关系感知跨语言实体对齐模块通过(实体,关系,实体)三元组以及其对应的(关系,实体,关系)三元组之间的影响来学习更好的实体表示,并通过连接GCN层来增强邻居的影响。论文在DBP15K的三个真实的跨语言数据集上进行了实验,把现有的跨语言实体对齐模型JE、MTrans E、JAPE、IPTrans E、Boot EA、GCN-Align、KECG、SEA、REA、RDGCN作为基线模型,进行不同评分函数的实验对比,实验结果表明,NSRDGCN方法明显优于这些基线模型方法,尤其在英文日文双语数据集中,NSRDGCN的对齐性能Hits@1和Hits@10分别提升了1.1%和1.3%以上。该论文有图20幅,表8个,参考文献99篇。
其他文献
为深入理解真菌多样性及其对环境变化的响应,揭示青海云杉适应本地高寒与干旱逆境的土壤微生物组作用机制,采用Illumina MiSeq高通量测序技术,分析了青海云杉Picea crassifolia根围土壤真菌多样性和群落组成及对海拔变化的响应。青海云杉根围土壤中共获得1179个真菌OTUs,隶属于10门43纲100目191科276属。在门水平上,担子菌门Basidiomycota和子囊菌门Asco
期刊
文本情感分类是自然语言处理领域中的一个重要问题。理解文本的语义,对文本进行分类,其核心问题是提取文本的特征。现有模型大多通过叠加CNN、LSTM或GRU网络来解决这一问题。但LSTM和GRU网络是单向时序模型,仍然偏向保存文本后端特征而遗忘文本前端特征。双向LSTM或双向GRU网络虽然能保存文本的前端和后端特征,但模型复杂参数量巨大,由于数据集相对有限,如果利用双向LSTM或双向GRU网络容易导致
学位
风电制氢进而合成氨(power to ammonia,P2A)是规模化消纳可再生发电资源,实现电力与化工行业碳减排的潜在技术路线之一。利用电制氢作为媒介,P2A可作为大型工业负荷参与电网能量平衡调节。然而,P2A负荷受化学工艺及过程控制的限制,负载调控惯性较大,当风电出力偏离预测轨迹时P2A负荷难以快速响应。为此,提出计及风电出力时序不确定性的P2A负荷随机最优控制方法。首先建立P2A系统柔性调控
期刊
随着5G通信技术的飞速发展,多标准、多模式系统对功率放大器提出了进一步的需求,而传统的功放系统由于功能单一、体积较大等劣势,已逐渐不能满足现代军用通信的需求。可重构技术及可重构功放的优势是各个频段之间的信号互不干扰,能够实现高集成度与智能化,且在每个频段内的性能都能达到最佳,因此在当今的军用通信系统中得到广泛的应用。在军用通信系统中,LDMOS器件以其增益高、频率稳定性强的优势已经成为射频领域的主
学位
煤与瓦斯突出是煤矿生产过程中的一种猛烈急剧的动力灾害,形成机理复杂,影响因素众多。随着近年来各类智能算法的快速发展,结合多种影响因素指标,将煤与瓦斯突出预测转化为非线性的分类问题,构建煤与瓦斯突出风险预测模型,使煤与瓦斯突出灾害的隐患实现早发现早解决,保障井下煤矿的安全开采。分析现有对煤与瓦斯突出发生机理的研究,结合地应力、瓦斯、煤体物理学性质三类因素,确定了预测指标体系,对灰色关联分析加以改进,
学位
永磁同步电机(Permanent Magnet Synchronous Motor,PMSM)由于具有效率高,功率密度高,结构简单等优点,已成为航空航天、电动汽车等领域驱动电机的重点发展对象。随着工业伺服控制中PMSM的使用越来越普遍,对系统高性能控制的需求也越来越高。由于运行中的PMSM参数具有不确定性,且温度、磁饱和程度也都在不断变化,传统矢量控制中的PI调节器易受电机参数和负载扰动的影响,导
学位
目的:探讨剖宫产术后切口感染的风险因素,以此制定针对性护理对策。方法:选取2019年5月-2021年12月我院收治的20例剖宫产术后未切口感染患者与20例切口感染患者作为研究对象,收集患者的临床资料分析导致切口感染的危险因素,并进行Logistic多因素回归分析。结果:年龄、妊娠合并症、BMI指数、术中出血量、手术时长、侵入性操作是导致剖宫产术后发生切口感染的危险因素(P <0.05)。经Lgis
期刊
农村消费是新消费的重要组成部分,是我国消费升级的重要领域之一。农村电商的规模增长,为国家精准扶贫工作提供了有力支持。在线购买行为促进了农村消费者群际分类,同时农村消费者对自我分类认知存在显著性差异。农村消费者对社会认同的认知差异又对其在线购买行为产生重要影响,立足农村线上消费市场研究现状,确定本文选题,从营销视角出发,将社会认同引入农村消费者线上购买领域研究。针对社会认同研究多聚焦在社会心理学领域
学位
近年来,由惯性导航系统(INS)与全球卫星导航系统(GNSS)相结合的组合导航系统广泛用于增强无人驾驶车辆的位置、速度和姿态信息。然而,GNSS信号易受复杂的外界环境影响,在遮挡严重的城市峡谷、隧道等地信号会发生中断,无法完成定位服务。因此,研究GNSS/INS组合导航系统在特殊环境下GNSS信号丢失时,如何能够提供可靠的导航服务具有重要意义。解决GNSS/INS组合导航系统中GNSS信号丢失问题
学位
在射频微波器件的设计中,需要在保证器件工作性能的前提下减少设计时间和成本,通常用CAD(Computer Aided Design)软件来建立射频微波器件模型。但在传统射频微波器件的设计中,需要不断优化各参数以满足设计指标,整个过程是耗时费力的。深层神经网络具有高维数据处理能力和复杂非线性关系的近似能力,因此将深层神经网络建模方法应用到天线等射频模块设计中。本文主要的研究工作概括如下:首先,针对基
学位