结合关系路径的远程监督关系抽取技术研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lonlychanging
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱作为目前人工智能研究和信息智能化服务的核心技术,往往面临着信息不完整问题。基于深度学习的实体关系抽取方法从无标注文本中抽取目标实体对存在的关系,是知识图谱补全的关键技术,但其训练所需的有标注数据通常较难获取。远程监督关系抽取依据远程监督假设,利用现有的知识图谱可以自动获取大量的有标注数据,但该方法也由于远程监督假设本身的缺陷存在着错误标注问题。当前主流的远程监督关系抽取模型往往采用多示例学习(Multi-instance Learning,MIL)方法,即按实体对的不同将所有句子分成一个个的包(Bag),每个实体对的关系作为包的关系标签,再进行后续的降噪和关系分类流程。然而该方法忽略了包与包之间的潜在的信息依赖,导致模型在包中的句子全部标注错误的情况下表现很差,进而影响模型的鲁棒性和整体的关系抽取效果。针对这个问题,本文通过包与包之间潜在的关系路径来建模包级别的信息依赖,按照关系路径的复杂程度分别提出了以下两个模型:(1)融合两跳关系路径的远程监督关系抽取模型。该模型首先通过多示例的学习方法对每个包中直接句子信息进行建模来获取关系标签的概率分布,然后对每个包的实体对之间存在的每一条两跳关系路径信息进行建模,从中选取置信度最高的那条关系路径来代表关系路径模块的推理信息,再通过关系路径编码模块得到关系标签的概率分布,最后采用联合学习框架综合每个包的直接句子信息和对应关系路径模块的推理信息,进而抽取每个包的目标关系。(2)结合多跳关系路径的远程监督关系抽取模型。该模型在两跳关系路径模型的基础上主要针对关系路径编码模块做出以下两点改进。其一是扩大了关系路径挖掘的范围,在每个包实体对之间存在的关系路径中引入三跳和四跳的多跳关系路径,从而建模包与包之间更加复杂的标签依赖信息,增强了关系路径编码模块的性能。其二是改善了多条关系路径信息融合的方式,采用注意力机制考虑所有关系路径的贡献,利用到了更多正例关系路径,从而提高了关系路径表示的效果。本文在Wikidata+NYT远程监督标注数据集上进行了多组对比实验分析,验证了引入关系路径信息的有效性和必要性,同时也设计了消融实验验证了注意力机制融合关系路径信息的有效性。
其他文献
12月16日,2021·中国港口机械智能控制技术研讨会暨第十一届中国港口装卸机械高新技术研讨会以网络直播会的形式在武汉胜利召开。本次会议由中国工程机械学会港口机械分会主办,武汉港迪技术股份有限公司、武汉港迪电气有限公司和武汉理工大学交通与物流工程学院联合承办,武汉港口机械质量监督检验测试中心和《港口装卸》杂志社联合协办。学会和承办方协商首次尝试以网络直播的形式召开此次会议,直播会议在线观看人数达到
期刊
在数据安全治理领域,我国应切实践行多边主义理念,加强与各国的互信,共同建立数据安全治理国际合作机制,合力应对全球性数据安全挑战。伴随着数字信息技术日新月异的发展,数据已成为数字经济发展的核心生产要素,是国家的重要资产和基础战略资源。当下,数据价值愈发凸显,数据安全风险也与日俱增,数据泄露、数据贩卖等数据安全事件频发,给个人隐私保护、国家安全防护等带来了巨大挑战。
期刊
基于网络安全模型和等级保护方法,提出全周期多层次数据安全保障体系。从治理、管理、技术层面,对金融数据实施数据采集、传输、存储、使用、删除销毁全生命周期安全控制。该体系满足数据安全法、个人信息保护法等法律法规和监管要求,提升了数据安全保障能力,保障了银行业务数据安全。
安全多方计算允许多个参与者使用各自的隐私数据进行计算,获得计算结果并且不泄露各自的隐私数据。标准的安全多方计算考虑半诚实敌手或恶意敌手模型下的安全性。2007年,Aumann和Lindell提出了隐蔽敌手模型,允许敌手的作弊行为以小概率成功,获得额外信息,但是以高概率失败,被诚实参与者发现。我们发现隐蔽敌手模型下敌手的作弊行为被发现后没有后续的惩罚措施,无法对敌手造成实质的影响。此外,隐蔽敌手模型
石墨烯具有优异的力学性能与物理特性,是一种潜力巨大的新型增强体材料。然而石墨烯不易分散,与铝的润湿性差等问题限制了石墨烯/铝复合材料的发展。本课题通过对石墨烯进行表面改性处理,提高石墨烯与铝的界面润湿性,再采用超声处理与机械搅拌相结合的方法分散石墨烯,减少团聚,并通过放电等离子烧结工艺实现了镀铜石墨烯/6061Al复合材料的低温烧结成型。本文探究了石墨烯表面改性对石墨烯在铝中分散、对复合材料界面结
风能作为一种可再生能源,取之不尽,用之不竭,并且在开发使用过程中不会产生较大污染。我国拥有丰富的风能资源,地理位置优越,合理开发利用风能资源对解决未来的能源枯竭和环境污染问题有重要意义。近几年来,我国海上风能得到了合理的开发和利用。对于远海的风电场,一般先将电能汇集到海上换流站,通过柔性直流输电输送到陆地换流站。在海上换流站工作过程中,一般采用就地取水的方式对机组进行直流冷却,然后再将温水向海洋中
目的非小细胞肺癌(Non-small cell lung cancer,NSCLC)是中国癌症相关死亡的首要原因。KRAS(kirsten rat sarcoma)是NSCLC中最常见的原癌基因之一,KRAS突变型NSCLC的治疗一直很困难,直到近年来才有了重大突破。SHP2(src homology 2(SH2)-containing protein tyrosine phosphatase 2
慢性精神分裂症通常具有较重的阴性症状,且抗精神病药物对阴性症状的改善作用并不理想;此外,近三分之一的精神分裂症患者的阳性症状也具有显著的抗药性,这说明还需要新的辅助疗法。重复经颅磁刺激(repetitive transcranial magnetic stimulation,r TMS,r TMS)是一种非侵入性的物理治疗方法,已有的研究表明r TMS对于精神分裂症是一种有潜力且有效的辅助疗法,1
宁夏枸杞营养丰富,食用历史悠久,已成为宁夏地区战略主导产业。但因其果实水分含量高、果皮脆弱,极易腐烂变质,难以流通运输,限制枸杞产业进一步发展。气调保鲜能通过抑制呼吸作用延长枸杞贮藏期,但贮藏后期会影响机体氧化还原平衡,促进抗氧化物质消耗,降低贮藏品质。水杨酸(salicylic acid,SA)能通过调节生理活动提高机体抗氧化能力,维持机体氧化还原平衡从而提高采后贮藏品质。因此,水杨酸与气调保鲜
齿轮泵作为一种在多个领域中广泛使用的液压系统供能元件,具有结构简单、对油污不敏感和自吸性良好等优点。由于齿轮泵存在内泄漏、困油和磨损等问题限制了其在高压系统中的应用。因此,研究齿轮泵的内泄漏规律及材料的摩擦磨损特性对提高其工作压力和使用寿命具有重要意义。本文基于高压双联外啮合齿轮泵开展了最优端面间隙理论分析、内流场仿真分析及试验验证、轴向间隙自动补偿方法及浮动轴套平衡性分析以及材料摩擦磨损研究。论