【摘 要】
:
随着互联网的快速发展以及网络信息的爆发式增长,如何快速高效地理解和利用网络中的信息成为人们关注的热点。知识图谱技术在这个环境下应运而生,它将网络中的数据抽取成事实三元组的形式,并可以广泛地应用在人工智能、信息检索等多个领域。在知识图谱的构建中,实体关系抽取和知识图谱补全是其中的两个重要子任务。本文针对实体关系抽取和知识图谱补全展开研究。首先,针对基于深度学习的远程监督抽取方法引入噪声数据的问题,本
论文部分内容阅读
随着互联网的快速发展以及网络信息的爆发式增长,如何快速高效地理解和利用网络中的信息成为人们关注的热点。知识图谱技术在这个环境下应运而生,它将网络中的数据抽取成事实三元组的形式,并可以广泛地应用在人工智能、信息检索等多个领域。在知识图谱的构建中,实体关系抽取和知识图谱补全是其中的两个重要子任务。本文针对实体关系抽取和知识图谱补全展开研究。首先,针对基于深度学习的远程监督抽取方法引入噪声数据的问题,本文提出了基于正负实例交互的实体关系抽取模型(PNIIM)。该模型先将远程监督方法标注的数据集输入到多规则联合的数据筛选器中划分出正负实例集,用正负实例集不断地迭代训练关系抽取器,在不断地迭代的过程中重新划分正负实例集;当关系抽取模型达到最终的稳定状态时,负实例集的数据即作为噪声数据剔除,用保留下来的正实例集作为训练集来训练一个高质量的关系抽取器。其次,针对现有知识图谱补全方法中很多模型只考虑了单一的三元组信息,忽略了三元组在知识图谱中的子图语义结构信息的问题,本文提出了融合子图卷积和张量分解的知识图谱补全模型(SCTD)。该模型获取待预测实体所在的子图语义结构信息并使用改进的子图卷积神经网络对其进行处理;设置系统参数将子图卷积模块与张量分解模块进行融合,对补充的三元组进行打分;选取分数最高的三元组作为可信的新三元组补充到原知识图谱中。最后,分别在不同的公开数据集上对所提出的PNIIM模型和SCTD模型进行了实验对比分析,验证本文所提方法的有效性和优越性。
其他文献
以梧州市蒙山县河湖水系连通工程技术方案设计为例,介绍了该工程的任务、理念和布局。通过水系互联互通,实施河道、湖泊治理工程、生态修复工程、水文化工程等,构建了蒙山县
广东省中山市1973年开始建立了鼻咽癌的全市肿瘤发病登记制度,其1974-1983年的资料已有分析报道。为了解中山市八直年代后期鼻咽患者的预后情况及其影响因素,对中山市1984-1988年登记的808例鼻咽癌患者进
本文报告了107例原发性肺癌侵犯胸壁的外科疗效,术后1年,3年,5年生存率分别为73.8%,45.5%,30.7%。文章着重讨论了术前诊断与估计,手术方式的选择及胸壁重建原则和方法,认为这类病变大都为周围型肺癌,只要无
在快速城市化和传统道路排水方式带来的问题下,城市交通环境受到了严重影响。因此,我们不能只关注道路结构的设计,还需要重视道路排水和绿化附属设施的设计。本文旨在通过运用海绵城市建设理念,针对城市道路进行改造研究,提出适用于城市道路各组成对象的改造方案,缓解我国城市面临的洪涝灾害频发和水资源相对紧缺的矛盾。本文首先分析了国内外的研究现状。围绕海绵城市“渗、滞、蓄、净、用、排”的理念,分析了适用于城市道路
<正>法国哲学家孟德斯鸠(C·L·Montesquieu)曾说:"炎热国家的人民就像老头子一样怯弱,寒冷国家的人民则像青年一样勇敢,气候王国才是一切王国的第一位"。以气候为代
针对拜耳法生产氧化铝过程中排放的高碱性赤泥无法大规模处理这一世界性难题,提出了钙化-碳化法处理赤泥新工艺.首先将赤泥进行钙化转型,脱去其中的碱;再将转型后的钙化赤泥
本文报道我院1988年3月至1993年2月未经治疗的全血细胞减少性急性白血病48例。该组病例症状以贫血,出血,感染较常见。外周血全血细胞减少,而骨髓像大多呈明显活跃或极度活跃。要和再生障碍性
介绍了洋溪水利枢纽工程及其临时滞洪影响区的概况。根据有关规范要求,因地制宜提出洋溪水利枢纽工程临时滞洪影响区处理方案,通过对安全楼和安全台两种避洪方案的分析比较,推荐
胎儿肝脏中低分子抑瘤物对肿瘤细胞体外作用的初步研究白海,吴祖泽兰州军区总医院(兰州730050)我们以往工作表明,在人胎肝中存在着一类低分子抑瘤物[1,2]。作者应用细胞生物学方法对其作了进
以太湖流域现状工程为基础,针对新建骨干工程新孟河主要控制建筑物设计不同的工程运行调度方案,利用成熟的数值模拟计算技术,模拟计算了“1991北部”百年一遇典型降雨条件下,