基于深度学习的关系抽取及关系推理

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:shiluze
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动通信和互联网技术的蓬勃发展使人类跨越式的步入信息时代。如何使用户便捷、高效、迅速地获取重要信息是亟待突破的前沿科学难题。通过关系抽取技术从无结构化的文本数据中获取知识,并存储在知识库中已成为一种趋势。从现有知识中推断出实体间缺失或者未知的关系的过程为知识库补全提供了新的支撑。本文利用深度学习技术对文本中的关系进行抽取,并对知识库中的关系进行推理,进而开发了一个基于众包模式的小型知识库系统。本文提出了一个使用多个预训练词向量的双通道关系抽取模型。在双通道模型中,一个通道是基于注意力机制的双向长短时记忆网络,另一个通道是卷积神经网络。此外,本文还设计了一个双通道融合方法。在Sem Eval-2010Task8数据集和KBP37数据集上分别获得了85.42%和62.2%的F1-score,实验结果表明双通道模型在未使用任何自然语言处理工具产生的语言特征的情况下表现优于现存的大多数模型。此外,本文提出的双通道融合方法较于现存的拼接或者相加方法有更好的表现。本文提出了一种新的基于路径推理的方法,该方法使用注意力机制将实体与其类型结合共同对路径中的实体进行表示,并使用注意力机制对每条路径预测的关系向量与给定关系的表示向量之差的绝对值进行汇总来计算模型的置信度。在基准数据集WN18RR和FB15k-237上进行实验,实验结果表明本文提出的方法比现有的基于路径推理的方法具有更好的性能。本文借助众包模式来搭建知识库,采取了前后端分离的方式进行设计,支持实体查询、增加、修改的功能。与常见的知识库系统相比,该知识库提供了众包功能。用户可以自主提交增加或修改实体信息的请求,在管理员审核通过后会合并到当前的数据库中。这种方式充分的利用用户提高了数据的实时性和可靠性。
其他文献
现如今工业机械设备朝着精密化、自动化、大型化和系统化的方向发展,滚动轴承的微小故障就可能对大型精密机械设备造成重大损害。机械零部件故障的诊断与预测一直都是保障工业机械设备稳定运行的基本条件。滚动轴承作为机械设备中不容忽视的存在,其稳定运转更是保障机械设备安全运作的前提。鉴于滚动轴承在工业设备中的重要地位,轴承故障诊断算法应运而生。而传统轴承故障诊断算法对专家知识要求高,设计的诊断模型结构复杂,并且
疲劳状态下的驾驶(疲劳驾驶)是引起交通事故的主要原因之一,给人们的生命和财产造成了重大损失。因此,设计并实现一种能够对疲劳驾驶准确地做出预警的方法,对减少因疲劳驾驶导致的生命和财产损失有重大意义。脑电图(Electroencephalography,EEG)记录了人大脑皮层神经细胞的电活动,可以直接反映大脑的即时状态,避免人为主观因素的影响,所以被认为是最有效的精神状态检测方法。传统的基于EEG的
在如今的大数据时代,购物类、服装类以及生活服务类等电商推荐系统层出不穷,系统的搜索以及推荐能力成为支撑该系统的核心技术,如何推荐给用户最满意的门店、商品也是系统的主要功能之一。然而通过研究发现:一些电商平台仍使用数据库关键词模糊查询的方式,导致搜索准确率低下;推荐系统中数据库压力日益增加导致数据提取速度降低;基于传统机器学习的推荐方式逐渐无法满足千人千面的推荐。针对上述问题,本文从数据库、搜索性能
单井分层结果是制定油田开发方案的重要依据。由于地质构造复杂、软硬件技术受限、数据处理方式不当等原因,初始单井分层数据可能存在误差甚至错误,因此,越来越多的科研人员开始研究分层数据的质检方法,目的是保证分层数据的准确性。目前油田分层数据质检的主要方法是现场专家根据先验知识,选择合适的测井曲线对井重新分层,进而通过对比前后分层结果进行校验。经过对某油田数据中心调研发现,在当前分层数据质检过程中,存在分
随着数据规模不断扩大,将深度学习模型应用在大规模图数据上,有效地提升了连边预测的精度,在推荐系统、社交网络等诸多领域具备较强的应用价值与潜力。近年来,虽然已有学者在同构图上开展对抗攻击研究,但针对异构图的安全性研究仍处于初步探索阶段。本文针对应用面较广的异构图推荐系统展开安全性探究。同时,进一步将研究拓展到一般性的多重异构图嵌入模型攻击问题中,探索了灰盒条件下的投毒攻击策略,验证了异构图深度学习模
随着科学技术的不断发展,计算机的硬件性能有了飞跃性的提升,随之而来的就是人工智能热潮。机器学习是人工智能的重要分支,它被广泛运用于各种领域,并取得了极佳的效果。各种基于文本编程的开发框架,有效地降低了专业人员进行机器学习建模的难度,但对于非专业编程人员而言,他们依然面临着搭建、优化模型需要复杂的背景知识,以及数据预处理、模型训练等关键步骤中繁琐的编程实现问题。因此研究一种能够降低机器学习建模门槛的
时至新时代的当下,我国作为能源大国对能源的绿色可持续发展越发地重视起来,区域综合能源系统作为推动我国能源体系建设的有效形式也因此迎来了崭新的发展契机。为了保障系统的运行管理、容量配置、优化调度等工作有效开展,需要对系统中多类能源的用能需求进行精准预测。但是与普通能源系统单一负荷预测相比,因区域综合能源系统接入了各种具有紧密联系的能源系统,导致各类负荷之间衍生出了复杂耦合关系,而现有的单一负荷预测方
乳腺癌是一种常见于女性的恶性肿瘤,数据显示,2020年全球乳腺癌新增病例高达226万例,首次超过肺癌的年新增病例数,成为世界范围内年度新增病例最多的癌症。自20世纪90年代以来,中国乳腺癌发病率的增长速度是全球增长速度的两倍之多,目前乳腺癌已成为中国女性发病率第一,死亡率第五的癌症。长期快速增长的发病率,使得国家和社会所面临的经济负担与健康压力日益加重。所幸的是,与其他癌症患者相比较,乳腺癌患者的
利用文献收集和数据整合的方法,对广东省不同红树林群落和地区的碳储量及碳埋藏速率进行了系统梳理。研究发现,广东省红树林的面积为9 106.21 hm~2,土壤碳储量为1 542.02 Gg C,土壤碳密度为0.23 Gg C/hm~2。广东省内红海榄(Rhizophora stylosa)和木榄(Bruguiera gymnorrhiza)群落的土壤碳密度最高,分别是0.27和0.23 Gg C/h
煤炭港口是现代物流行业的重要组成部分,装备智能化是港口迈向集约化、绿色化、高效化发展的必由之路。取料机作为散货运输的重要设备,实现无人化作业更是装备智能化的重要发展方向。目前针对煤炭港口应用场景的感知技术研究仍比较匮乏,虽然部分港口已实现了取料机无人作业,但是仍存在使用限制条件多、作业效率低、操作员观察困难等问题。因此,开展取料机无人化作业中感知系统相关技术研究,对推动港口装备无人化技术发展、加快