基于深度学习的远程监督关系抽取

来源 :武汉邮电科学研究院 | 被引量 : 0次 | 上传用户:hongjiansu1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代的急速发展使得人们在互联网上存储及运用的文本数据规模急剧增加。为了从海量的文本中发现目标信息,信息抽取技术应运而生。作为信息抽取领域重要的研究课题,针对实体关系抽取的研究,其根本目的在于从半结构文本或非结构文本中发现实体之间的语义关系,以便人们快速的理解复杂文本中的隐藏信息。具有较强的研究价值和研究意义。本文主要研究了在远程监督数据集上的关系抽取任务的实现,基于深度学习技术与远程监督思想提出了一种新的实体关系抽取方法。针对远程监督数据的特点,在总结现有的研究基础上,本文分别从实体关系特征提取和抑制噪音数据影响两个方面开展研究。在实体关系特征提取方面,以往的关系抽取研究中深度学习模型通常只包含浅层卷积神经网络结构,设计的模型只能提取到浅层的语义信息,因此本文从网络深度的角度出发,通过引入深度残差网络技术以提取更高层的特征语义信息使模型可以学习到更丰富的关系特征,设计了多层网络模型实验以探索更适合的模型深度;在抑制噪音数据影响方面,现有的研究偏重于引入句法结构等信息,需要大量的专家知识,而本文从句子信息对目标关系的重要性角度出发,在池化层引入注意力机制用以自动捕捉更加关键的特征信息从而降低噪音信息的影响,通过Attention Pooling模型实验验证结果。最后结合两种算法的优点提出了一种新的模型结构。综上,本文结合注意力机制和深度残差网络设计了一种新的深度学习模型ARCNN。实验结果显示,相比几种经典的远程监督关系抽取模型,本文的模型一方面可以有效地减轻远程监督数据中的噪音影响,另一方面可学习到远程监督数据中包含的更抽象的高层关系语义特征,最终较为精准的发现复杂文本中的实体语义关系。
其他文献
百度无人驾驶汽车的推出和棋圣李世石在“人机大战”中以1:4惨败于Google的AlphaGo事件的发生,使得人工智能迅速被大众所熟知。作为人工智能(Artificial Intelligence,AI)领
对于现阶段复杂的工程问题:隧道开挖对地下管线的影响是当前一个热点和难点。重庆地势高差大,隧道开挖易出现距离地下管线很近的情况,处理不当就会产生管线破坏甚至造成工程
航管二次雷达作为民用航空重要的监视工具之一,在保障民航飞行安全中扮演着重要角色,不仅能保障航班的正常运行,同时也丰富了管制指挥手段。近年来,我国的民航事业发展迅速,
目前,过渡金属氧化物作为优良的锂离子电池负极替代材料被广泛研究。在过渡金属氧化物体系中,Zn Fe2O4具有较高的理论比容量(1000.5 mAh g-1),价格低廉,含量丰富,对环境无毒
一、概述毛霉菌病(Mucormycosis),是一种由毛霉菌目真菌所致的疾病,也是一种威胁生命的条件致病性真菌感染。毛霉病是一种相对少见的真菌病。一项基于人群的研究提示,在美国,
会议
在信息时代,不同语言的人们之间进行跨语言的交流也会越来越频繁。传统的人工翻译由于其翻译效率等问题,已经逐渐满足不了当前人们的翻译要求。由于机器翻译具有一定的高效性
随着化石能源的过度利用和环境污染的不断恶化,人类社会迫切需要可持续、清洁的能源来满足不断增长的能源消耗和环境保护需求,使用可再生能源的趋势在最近几年中显著上升。在
目的探讨熵理论在过劳性脏腑功能耗竭研究中的应用。方法从系统熵涨落理论角度研究过劳性脏腑功能耗竭发生、发展、变化规律。结果过劳作为熵在人体变化信号,正是反映人体体
会议
电致化学发光(ECL)分析技术因具有背景信号低、灵敏度高、选择性好等优点,已被广泛用于生物传感领域。然而,为满足临床诊断中对低含量目标物,特别是对复杂样品中低丰度生物标志
徐XX,男,4岁主诉:多颗乳牙牙龈化脓求治现病史:患儿母亲述"患儿乳牙迟萌,牙龈脓肿,乳牙早脱落,近来进食有酸痛感",遂求治。系统疾病史:1年前于外院诊断为"佝偻病",服用"羧甲