一种新的基于深度学习的重叠关系联合抽取模型

来源 :中国科学院大学学报 | 被引量 : 0次 | 上传用户:llaaxzl123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展和移动设备的普及,我们每时每刻都被各种各样的信息包围着.如何从海量的数据中挖掘出具有价值的信息一直是国内外研究的热点.其中,关系抽取是信息抽取的一个重要子任务,目的是从文本中识别出实体之间的关系,从而挖掘出文本中的结构化信息,即事实三元组.在文本中,实体重叠和关系重叠是非常普遍的现象,但是现有的联合抽取模型不能够有效地解决这类问题,因此提出一种新的联合抽取模型,将关系抽取任务看作由2个子任务实体识别和关系识别组成,并分别使用序列标注的方法和多分类方法进行识别.在联合抽取过程中,为充分挖掘文本语义信息,在模型的输入层添加词性(POS)和句法依存关系(Deprel)特征,同时为消除随着句子长度增加带来的长距离依赖问题,在模型中引入注意力机制.最后,论文在NYT数据集和WebNLG数据集上进行关系抽取实验,结果表明论文提出的模型能够有效地解决关系重叠的问题,并取得最佳抽取效果.“,”With the rapid developments of Internet technologies and popularization of Internet among daily activities,we are surrounded by all kinds of information every moment.Hence,to mine valuable information from massive data has always been a hotspot of research at home and abroad.In this environment,relationship extraction is an important subtask of information extraction,which purpose is to identify the relationship between entities from the text,so as to mine the structured information in the text,that is,fact triplet.In the text,entity overlapping and relationship overlapping are very common phenomena,but the existing joint extraction model cannot effectively solve such problems,so the paper proposes a new joint extraction model,which regards the relationship extraction task as consisting of entity recognition and relationship recognition of two subtasks.The two subtasks are identified using sequence labeling method and multi-classification method,respectively.In the joint extraction process,in order to fully mine the semantic information of the text,the part of speech(POS)and syntactic dependency(Deprel)features were added to the input layer of the model.Attention mechanism is also introduced in the model,which can eliminate the problem of long-distance dependence as sentence length increases.Finally,the paper conducts relationship extraction experiments on the NYT dataset and the WebNLG dataset.The experimental results show that the model proposed in the paper can effectively solve the problem of overlapping relationships and obtain the best extraction effect.
其他文献
为提高无线传感器网络数据融合精度,降低网络能耗,延长网络生存时间,提出基于改进灰狼算法优化BP神经网络的无线传感器网络数据融合算法(IGWOBPDA).首先为平衡灰狼算法全局与局部搜索能力提出改进控制参数和动态权重更新位置的改进灰狼方案,利用改进灰狼算法对BP神经网络初始阈值和初始权值进行优化以解决数据融合中BP神经网络对初值敏感、易陷入局部最优的问题;其次考虑到无线传感网实际传输节点能耗和分簇情况,提出基于节点剩余能量参数和节点密度参数的分簇方案,通过调整参数的权重因子来适应网络数据融合传输过程中的实际
2021年,一波又一波始料未及的社会和文化事件接踵而至,敏锐而丰富的文化研究成果奏响了现实关切的低音,以批判的棱角直指生活中那些隐而不现的真相,有助于我们了解这些纷繁复杂的文化现象和议题.
当前,我国新教育改革进程的深化发展,使得国家及社会都更加重视到学生通过教育所形成的综合能力与自身素质,因为这不仅仅关系到学生自身的学业规划,更关乎到其未来的长期发展.基于此,本文将通过欠发达地区高中生英语自主学习能力现状,探究欠发达地区高中生英语自主学习能力培养方法,以此促进中国教育与学生的更好发展.
高中数学是高考所考查的重要科目之一,备受教师和家长重视和关注.但是,随着新课程的改革,传统的课堂教学模式已无法满足当前数学教学需求.过于单一机械的教学方式会造成学生课业沉重,不利于学生数学成绩的提升.因此教师要深刻认识到这一点,调整全新的教学模式,创新教学思维,善于运用课堂提问来提高教学的有效性.文章主要阐述高中数学课堂提问遵循的基本原则,并提出行之有效的教学措施,希望对高中阶段数学教育工作提供借鉴参考.
针对传统多相位DLL(delay locked loop,DLL)电路存在的大面积、高功耗、设计周期长、不便于移植到其他工艺等缺点,提出一种产生多时钟相位输出的全数字延迟锁相环(all-digital delay locked loop,ADDLL)电路.该电路在SMIC 55 nm CMOS标准工艺下基于标准单元设计实现.使用相位合成模块产生多相位输出,可以通过级联更多相位合成模块产生更多输出相位.与传统多相位DLL电路相比,ADDLL电路面积更小、功耗更低,且采用标准单元设计,可以减少设计周期.后仿真
16世纪的医师认为通过亲眼观看可以突破描述而到达绝对,从而使得药物植物学和人体结构上升到亚里士多德的理论知识.富克斯、格斯纳、维萨留斯分别借助了偶性、形式、典范这些古典概念来完成这种转变.近代早期的自然哲学家、医师在继承亚里士多德—盖伦的生理体系的同时,不断突破.这不仅是方法论上的改变,也是形而上学的改变.
2021年的儿童小说出版在建党百年的重要时间节点上呈现出了一种明显的"回升"态势,其中以主题出版和现实主义题材为热点.幻想小说中唯科幻小说势头强劲,在引进与原创的合力下占有着童书市场的可观份额.传统文化题材小说与"作家小时候"则在市场的反馈作用下形成了一种新的增长点.
在高中英语的学习过程中,许多学生均面临着不同的英语学习困难.因此,教师一定要设计可以激发英语学习动机的教学活动,增强英语学习的趣味性,提高学生的英语学习热情,建立学生的语言学习自信.本文就如何系统性建立高中生英语学习自信的策略展开研究及讨论.研究发现,通过周期性地实施以RSAAS动机模式为基础的激励策略,可以增强学生的英语学习兴趣,从而建立稳定的英语学习动机及自信.
近两年,一系列与侵害女性相关的社会事件接连曝光,关于女性安全、家务与生育劳动、教育与职场歧视等"女权"方面的争论成了舆论场上最喧闹的议题之一.值得警惕的是,女性主义之理论和概念有被误读、滥用乃至污名化的倾向——似乎人们忙着"站队",反而忘记了两性结构性平等的初义.2020—2021年度译介出版的若干女性主义研究专著或许对当下的经验颇有助益.希望在这个充满"喧哗与骚动"的时刻,它们能帮助我们更好地理解中国女性主义思潮中的诸多现象.
2019年至2021年,日本的中国文学研究界总计出版图书17部.研究主题从经典作家延绵至大众文学,呈现出多元化的样态.而少女中国、女作家的越境叙事等专题研究则展现了日本学界独有的问题意识.从作品性质来看,在文学史与文论两方面皆有重磅成果,且新发现的史料能够快速应用于研究中,显示出日本学界史与论学统间的有机结合.