基于多语言BERT跨语言对齐的命名实体识别研究

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:cnm008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体作为自然语言文本的关键语义信息,其识别与分类是目前自然语言处理中的重要研究内容。BERT模型通过预训练技术从无标签数据中学习到无监督深层双向表征,然后额外加一层分类器就可以在下游命名实体识别任务中微调后取得出色的性能,但是每种语言都必须学习独立的参数而无法在各语言间实现跨语言迁移。此时有可以支持多种语言的单一模型至关重要,而使用104种语言的语料库上联合训练的多语言BERT,在没有显式监督信号和平行语料库的情况下却可以学习到跨语言表示。实验表明,在良好迁移条件下,多语言BERT模型在每种语言的命名实体识别迁移学习中结果稍稍逊于单语言BERT模型,并且表现了其在资源稀缺语言的命名实体识别任务上出色的跨语言迁移性能。另外,深度学习的成功严重依赖大规模标注数据,相对于资源丰富语言,资源稀缺语言很少甚至没有人工标注的数据集,而多语言BERT模型可以在命名实体识别任务中通过零样本跨语言迁移很好地泛化到各种资源稀缺语言中。为了进一步提高多语言性,本文提出了基于线性旋转与基于非线性微调的两种跨语言对齐方式,利用平行语料库或者双语字典作为监督信号源来对齐多语言BERT中的语言子空间。前者旨在学习一个线性旋转变换,以将源语言嵌入空间投影到目标语言嵌入空间中的相应位置;而后者通过微调权重,最小化单词及对应翻译嵌入之间的均方差损失函数,从模型内部进行源语言嵌入空间和目标语言嵌入空间的对齐。实验表明,在结构化命名实体识别任务中基于旋转的对齐大大改善了多语言BERT的跨语言性,实现了较好的零样本跨语言迁移提升。而基于微调的对齐在某些语言上不仅没有助益,反而破坏了原始多语言BERT空间中的对齐,不适用于NER这种与语义无关的结构型任务。
其他文献
学位
地球物理勘探的主要目的是探明可能的石油气储藏,探测过程的实质是利用人工震源激发地震波,再采用不同的检测方法接收地层响应,进而观察分析预测地层的状态和性质。AVO(amplitude variation with offset)技术研究了地层介质参数和地层响应之间的关系,该技术的正演过程总结地层特征建立油气标志,反演过程利用地层反射波信息重构储层。自20世纪80年代以来,关于AVO技术的研究一直在发
学位
海洋可控源电磁法(MCSEM,Marine controlled source electromagnetic)目前被应用十分广泛,尤其是在勘探地层资源方面,具有对高阻体反应灵敏的优点。然而,由于海底环境的复杂性,接收系统采集到的信号通常都叠加着复杂的噪声,对后期数据资料的分析和解释带来一定难度,所以对MCSEM数据开展去噪处理工作非常有必要。为了提取原始信号的数据特征,必须通过技术手段对信号中夹
学位
为响应国家节能减排和低碳发展战略的重要举措,在暖通空调领域,干空气能驱动的蒸发冷却技术和低品位热能驱动的制冷技术(如喷射式制冷)逐渐受到大家的关注。其中,蒸发冷却技术优势为节能环保,但其冷却效果易受气候条件限制。喷射式制冷系统结构简单、体积小、成本低,其运行性能不稳定,效率易受背压等因素的影响。在此背景下,课题组提出一种将蒸发冷却与喷射制冷复合的空调系统,该系统充分结合两种制冷技术的优点,使得复合
学位
本文针对纺织空调系统负荷随季节波动性变化导致自控系统对车间温、湿度难以精确控制的问题,旨在研发一种能在有效控制车间温、湿度同时又能节能的纺织空调自控系统。为此,本文采用将空调基础理论与空调系统实际运行相结合的研究方法,对纺织空调自控系统做了以下研究:首先,分析盐城射阳站近三年的气象参数,得盐城全年气象呈4季7阶段变化。经过详细分析和计算得到该地区空调自动控制调节区及车间外空气参数变化规律,对盐城某
学位
随着电子电器集成化、微元化的发展,元器件工作环境的频率也不断变高。在高频化的大趋势下,必须重新考虑和认识过去常被忽略的那些分布参数。对于经常应用于各种变压器、开关电源中的电感线圈,在高频环境下不仅要关注其本身的电感性能,还必须注重分布电容的影响。对于一个实际存在的线圈,分析其分布电容可以利用测量的各种方法。但如果在设计电感线圈时想要知道参数条件下的分布电容值,是无法通过测量方式获得的。本文针对不同
学位
空间环境中的高能辐射粒子对SRAM型FPGA易造成单粒子翻转的危害。当功能电路的敏感位置发生单粒子翻转时,电路就会出现故障,造成重大的经济损失。因此,为了加强FPGA应用于空间环境时抵抗单粒子翻转的能力,需对其功能电路进行防护处理,那么对防护设计的可靠性进行评估验证成为必要环节。近些年,国外开始采用故障注入的方法对电路进行可靠性验证,它通过修改FPGA的配置bit位来模拟单粒子翻转对器件的影响。从
学位
经济市场发展为城市化提供了动力,同时也为城市化过程中城市管理提出了新的要求。但对于城市管道的建设,直埋式的城市管道正日益暴露出一些弊端。城市综合管廊将所有类型的城市电力,电信,天然气,供水和排水管道集中放置并统一管理,在城市下方建立隧道空间特殊的进入口,吊装口,通风和监控系统,对城市升级发展起到了至关重要的作用。本文归纳总结了综合管廊常用的通风形式,利用CFD软件,对城市地下综合管廊电力舱内通风散
学位
随着科学技术的发展,工业生产对压缩机的需求越来越多。在火力发电厂中需要用到空气压缩机进行元件控制、相关物料的运输以及锅炉除灰等,被称为第四大能源。国外进口的空压机一般设有高温保护装置,夏季厂房运行时环境温度会急剧升高,触发进口空压机的保护装置进而停机,会对电厂的正常运行造成损失。高大厂房在通风降温时需要大量的风量和冷量,若采用传统的机械制冷,初投资和运行费用都较高,并不节能。而蒸发冷却是一项绿色节
学位
目前我国炼油能力位居世界前列,但存在炼油产能严重过剩而化工产能不足,原油重质化、高硫化与成品油清洁绿色化的需求矛盾等问题,因此炼油化工一体化是必然趋势。在此趋势下,如何提高企业的经济效益,企业计划的优化管理显得尤为重要。基于此,针对炼油化工生产过程,提出了炼油化工生产过程与公用工程集成计划优化模型。论文主要的研究内容如下:(1)针对炼化生产中如何准确描述过程模型问题,深入分析不同装置的生产过程特点
学位