基于深度神经网络的关系抽取任务研究与应用

来源 :江南大学 | 被引量 : 0次 | 上传用户:vince_yang_666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对大量半结构化和非结构化的文本信息,如何从这些信息中自动提取出结构化、有价值的信息是信息抽取的一个重要课题。关系抽取是信息抽取的重要子任务之一,关系抽取的质量直接决定了知识图谱的质量。越来越多基于深度神经网络的方法应用在关系抽取任务上并取得不错的效果,但是依然存在对实体表征的提取不够充分的问题,针对这个问题,本文对句子级别和文档级别关系抽取模型进行改进,提升模型的性能,同时围绕关系抽取模型搭建出关系抽取应用平台。论文的主要工作和创新点如下:1.在句子级别关系抽取任务中,针对基于位置注意力的关系抽取模型(LSTMPosition-Attention,LPA)中存在实体相关特征利用率低、文本结构特征和位置特征提取不充分的问题,构建一个基于BERT预训练模型,下游叠加长短期记忆网络和实体位置注意力组组合的新模型。在数据预处理时,用特殊字符标记实体位置同时用实体类型信息遮掩目标实体,充分提取位置特征和实体类型特征等潜在特征。通过在TACRED和Sem Eval 2020 Task 8上测试,实验结果表明改进后的模型性能指标要优于部分先前的模型。2.在文档级别关系抽取任务中,针对图聚合推理网络模型(Graph Aggregation-andInference Network,GAIN)使用图卷积神经网络在提取提及级别图特征时,图节点聚合时无法反映出邻接节点重要性的问题,提出利用图注意力网络对该问题进行优化,同时在提取实体特征时,利用BERT注意力机制提取实体相关上下文信息融合进实体特征,增强实体特征表达。通过在Doc RED数据集上测试,实验结果表明改进后的模型性能指标要优于先前的模型。3.围绕本文关系抽取模型,设计并实现关系抽取应用平台系统。系统利用模块化设计思想处理关系抽取模型。系统分为Web端和移动端应用系统,Web端主要实现模型管理和关系抽取等功能,移动端由微信小程序实现,微信小程序作为Web端功能的扩展,主要实现模型训练监控和模型数据对比等功能。关系抽取功能需要调用关系抽取模型实现关系分类任务,关系抽取模型封装为微服务向Web服务和微信小程序服务提供服务,同时不同服务之间实现系统数据共享,关系抽取后结果以实体对的形似保存在数据库中形成小型知识图谱。
其他文献
随着工业生产规模的不断扩大,涉及的操作单元和过程变量不断增多,同时过程数据呈现出非线性、非高斯性、动态性等复杂特征,基于全局模型的故障监测方法难以满足目前的工业生产需求。基于分块策略的多块故障监测方法可有效应对上述问题,是目前工业过程故障监测领域的研究热点。在现代工业过程故障监测中,仍然存在局部信息难提取、监测信息单一以及变量块划分阈值难确定等问题,本文基于分块策略对工业过程故障监测方法进行研究,
学位
随着手机等移动设备的不断发展,多种无线技术可以在室内定位领域中提供精确的定位与导航服务。基于蓝牙接收信号强度的指纹库定位技术由于其功耗低、成本低、易用性高以及定位精度高等特点,被广泛用于室内定位系统中。但在室内场景中,各个用户使用的移动设备不同,其所接收的来自蓝牙信标的信号强度也有所差异,导致同一个定位系统各个用户的体验不同,并不能让所有人都获得精确的定位结果。同时,室内的环境也具有时变性。接入点
学位
工业生产过程中,如何快速准确地检出故障对过程安全性、连续性具有重要意义。伴随生产过程的智能化、自动化及工业大数据的发展,大量工业过程中的传感器信号得以记录下来,基于数据驱动的故障检测方法开始成为主流。数据驱动模型根据建模方式又可分为机器学习模型、深度学习模型、统计分析模型等,生成对抗网络作为深度学习方法中的一种,通过博弈对抗思想进行无监督训练,所得模型可以很好地解决回归分类等问题。因此,本文采用生
学位
微纳操作技术被广泛应用于材料制造、微电子装配和生物医疗等众多领域,对推动人类科技发展起着至关重要的作用。光诱导介电泳(optically induced dielectrophoresis,ODEP)作为一种新兴的微纳操作技术,结合了介电泳技术和光学技术,具有高效、灵活、可重构、低功耗和无损伤的优点,并在微纳粒子的运输、排列、分离等操作方面获得了许多研究者的广泛关注。然而,传统的ODEP都是以手动
学位
控制器性能优劣决定着工业设备能否安全、高效、平稳、低耗的运行。在现代控制工程中,用于提高控制器性能的方法有很多种,包括常规的PID控制器整定技术,最优控制以及预测控制等先进控制方法。此类方法的实施一般依赖于精确的过程对象模型。但由于系统的变量众多,内在机理复杂以及耦合存在,过程对象动态特性的描述以及精确模型的建立十分困难。因此,设计有效的控制器并长时间维持良好性能存在挑战。与此同时,得益于计算机和
学位
随着我国人口老龄化加剧以及出生率降低,未来老人会越来越多,青壮年会减少,社会人力成本会大大增加,这为服务器机器人提供了极为广阔的市场。而自主导航技术作为服务机器人的核心技术,则会受到越来越多的关注。本文主要研究室内场景下的移动机器人运动规划算法,分别设计了融合JPS和改进A*算法的路径规划算法以及基于Bezier曲线改进的最小跃度轨迹规划算法。本文在路径规划方面,针对传统A*算法在工厂场景较大的栅
学位
近年来,随着人工智能、工业技术不断发展,出现了很多规模庞大、结构复杂的控制场景,面对这些结构复杂的控制场景,单个自主体能力有限的问题日益突出。而多自主体系统的出现显著提升了控制系统智能化程度,克服了单个自主体能力有限的缺点。在实际工程应用中,多自主体系统追捕问题展现出较大的应用前景,在军事对抗、灾后搜救、无人驾驶、民用安保等领域均有涉及。因此,对于多自主体系统追捕问题的研究具有十分重要的工程应用价
学位
近些年,随着我国绿色发展战略的不断推进,各类污水治理和达标排放显得尤为重要,而污水处理过程的优化控制为其提供了有效的方法。考虑到污水处理过程是一个极为复杂的非线性系统,污水处理厂需设计高效、智能控制系统,以实现在复杂工况下依然能达到严格的出水质量标准,并尽可能地降低能源消耗。因此,本论文深入研究了针对污水处理过程的智能优化与控制方法,论文主要工作及创新点如下:(1)分析活性污泥法的工艺流程和机理,
学位
传统仪表在生产生活中应用非常广泛,而且传统仪表示数的自动读取对仪表检验和工业过程监测具有重要意义。但目前传统仪表主要依赖人工读数,存在诸多限制,相比于人工读数,利用机器视觉技术进行读数识别不仅效率高、成本低、数据可视化,还能够为传统工厂的现代化改造、仪表测量精度的检验以及长期运行仪表性能的抽查提供一种实际可行的方案。为实现传统仪表示数的自动读取,本文提出基于机器视觉技术的仪表示数自动识别方案,并针
学位
交直流混合配电网凭借灵活利用交流和直流电能的优势,将成为未来配电网发展主要趋势。由传统电力变压器发展而来的能量路由器,具有电压变换、潮流控制、能量双向流动及提供多样化即插即用接口等功能,被视为未来实现交直流混合配电网互联的关键设备。研究以能量路由器为配电枢纽的配电系统潮流计算及最优潮流模型,对实现未来配电网的科学规划和优化运行有着重要指导作用。相比于十分成熟的交流配电网潮流计算方法,含能量路由器这
学位