基于深度学习的多标签实体关系抽取研究

来源 :聊城大学 | 被引量 : 0次 | 上传用户:dexiaolu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体关系抽取是自然语言处理(Natural Language Processing,NLP)领域中一项最关键的基础任务,要在大量非结构化网络文本数据中自动提取出潜在的复杂语义关系。多标签实体关系抽取则是实体关系抽取中比较复杂的一项任务,是指在包含多个实体的句子中,抽取出多个实体之间的相互关系。在单句多实体中抽取多实体之间的关系比在单句双实体中抽取两个实体之间的关系更加复杂。目前,学者们把大量深度学习网络模型应用于自然语言处理领域中的实体关系抽取任务中,例如一些基于卷积神经网络(Convolutional Neural Network,CNN)的改进模型以及循环神经网络(Recurrent Neural Network,RNN)的改进模型,在实体关系抽取中都取得了不错的效果。但是这些模型只是在单句双实体的关系抽取中取得了不错的效果。由于卷积神经网络模型局部计算以及多标签数据集中关系重叠和特征离散等特点,将此类模型应用于多标签实体关系抽取中,实验结果并不理想。针对以上问题,在多标签实体关系抽取研究中进行以下研究:(1)实验训练数据集为爬取的人文信息领域的批量文本数据,采用了胶囊网络模型来进行特征聚集,并在传统胶囊网络低层胶囊往高层胶囊传递信息的动态路由算法中加入了注意力机制,改进了原有的胶囊网络模型。改进的模型在信息传递过程中,能够更加准确地放大有效特征的传递、缩小甚至忽略无用特征信息的传递。通过对比模型实验结果,验证了改进模型的有效性。(2)为了减小数据集中原始噪声数据对整个模型的影响,增添了一个句子过滤器模型,采用在句子过滤和关系抽取中部分参数共享的联合模型来进行处理。首先对数据集中的噪声数据进行一步过滤降噪处理,然后再在降噪后的数据中完成实体关系抽取。关系抽取任务中采用了改进动态路由算法的胶囊网络模型。两个模型共享模型参数。联合训练在实体关系抽取模型中每一次迭代都会去更新共享参数,然后再作为句子过滤器的输入参数用来选择更好的句子,这样在训练过程中两个模型能够相互影响、相互优化。通过与其他模型进行实验结果对比,验证了联合模型的优越性。
其他文献
为解决全球能源危机、缓解温室效应和环境恶化,减少化石燃料的使用、提高清洁能源供应多样性成为主要的解决方案。核能和风能是清洁能源中的重要组成部分,800H奥氏体不锈钢和304LN奥氏体不锈钢分别在核能和风能发电中起着至关重要的作用。为解决压水堆核电站蒸汽发生器传热管的晶间腐蚀问题,800H奥氏体不锈钢焊接接头晶间腐蚀敏感性主要通过改进焊接方法和焊后处理的方式来实现,为解决传热管的晶间腐蚀问题提供了一
随着生活水平提高,驴肉作为一种营养丰富兼具保健功能的肉类日益被人们接受。但驴肉自身高蛋白、高肌红蛋白含量、高不饱和脂肪酸的特性决定了它比其他禽畜肉更易发生腐败和品质劣变。目前对驴肉保鲜贮藏技术研究较少。本课题以驴肉为研究对象,探究了驴肉4℃冷藏贮藏过程中理化品质及微生物变化规律。同时通过MIC最小抑菌试验和响应面法优化了复合生物保鲜剂的配比,延长了驴肉冷藏保鲜期。1.试验对驴肉4℃冷藏贮藏下理化指
根据卫生部的报告[1],城市居民中处于亚健康状态的高达70%,但只有4.8%的人去医院,接近80%的人首先在网上寻找信息。传统的搜索引擎难以提供正确的医疗信息。公开数据显示[2],2020年,至少50%的人机交互设备将具备语音功能。基于上述背景,本文拟研究基于语音对话方式的智能问诊系统。智能问诊系统的诊断流程是:用户陈述病情,系统根据陈述文本进行疾病分类得到初始疾病假设,当病情信息过少不足以确诊时
随机Loewner演变或Schramm-Loewner演变(SLE)是由O.Schramm引入的一类含一个参数的随机平面增长过程,该过程可以通过驱动项为一维布朗运动的经典Loewner微分方程的解来描述.本文的主要工作如下:第一,讨论了带形区域内壳的容量估计.给出带形区域内壳的容量的期望表达式;建立了带形区域内壳的容量的一些估计式;给出带形区域内壳容量的一种几何阐述.第二,建立了多裂缝的偶极Sch
红外成像海面多目标检测技术是指在所给的红外图像中,要将图像中出现的目标对象找出,并且将它们的位置准确的标记出来的一种图像处理技术。在计算机视觉研究领域中,红外成像海面目标检测技术一直是各个国家国防部门研究的重点,它的主要应用领域还是在军事上,但是目前也逐渐的向民用方向上发展。红外海面多目标检测技术的难点有,目标尺度的多变性、宽基线造成的目标几何多样性,再加上海杂波干扰影响等等,这些都给红外图像的多
随着现代社会互联网技术的发展,个人电脑已成为人们生活中不可或缺的一部分。人们在享受电脑带来的便利的同时,也面临着文件数据安全的相关隐患。人们对于电脑的操作离不开对电脑文件的储存和传输,而这些操作都存在着数据泄露的风险,因而安全的文件加密管理系统对于各行各业的发展都有着十分重要的意义。内容关联密钥加密技术作为一种全新的密码技术,通过对明文抽取生成密钥的方式,在保证了文件加密效率的同时极大提升了安全性
当前,为充分发挥结构拓扑优化极高的设计自由度与增材制造极高的成型自由度优势,开展面向增材制造的结构拓扑优化研究已成为结构优化领域的研究热点。但是由于增材制造中存在一系列工艺约束,如通过设置悬垂角度约束来避免结构悬空区域会引入额外支撑结构的问题,制造设备会存在最小特征尺寸约束等,在拓扑优化中考虑上述增材制造约工艺约束显得很有必要。同时,结构打印成型方向不同,结构打印件性能也会发生变化,考虑成型方向对
建筑业的施工安全事故频发,针对一线建筑工人的施工安全教育是减少事故发生概率的重要手段之一,但是目前建筑施工企业开展的安全教育多流于形式,甚至缺失对新入场建筑工人的安全教育,开展施工安全教育的效果不显著。造成上述现象的一个重要原因是建筑工人参与安全教育的主动性较差。同时,由于我国建筑工人文化水平较低、安全素质较差、高流动性的特点,导致建筑工人没有形成安全意识,塑造安全行为习惯的难度较大,从而影响了建
社会工业文明的不断进步,给人类日常生活带来便利的同时也伴随着环境污染问题日益严重。目前水体污染在各类污染中所占比重越来越大,水体富营养化、淡水资源变少以及水生动植物生存受到严重威胁。而水体污染中有机染料如亚甲基蓝、甲基绿等被认为是具有高毒害性的有机污染物,因此各种有机污染物去除方法和功能材料被广泛研究。在诸多有机染料污染除去方法当中,吸附法具有技术成熟、成本低廉、除污效率高、无二次污染等优点,而被
随着微纳米制造技术的飞速发展,微细加工领域的纳米级工艺已经趋近成熟。在微小工件的超精密加工和检测过程中,对于生产与测试环境的要求也愈来愈高。其中严重影响加工与检测精度的一个因素是环境与相关设备的微弱振动。如何安全可靠的将这些微振动与微纳米加工和测试设备隔离,构成超精密装备与微纳米设备领域亟需解决的关键难题之一。为克服被动振动控制的不足,基于压电叠堆执行器的主动隔振平台开始受到国内外关注。本文以基于