基于迁移学习的文本序列标注研究

来源 :中原工学院 | 被引量 : 0次 | 上传用户:farzision
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本序列标注是知识图谱、问答系统等下游自然语言应用任务的基础。传统的文本序列标注使用单任务学习方式,但数据量少时这种学习方式难以学习到正确的潜层信息分布。为了解决单任务学习存在问题,迁移学习应用到文本序列标注任务并取得了较好的效果。一般,文本序列的迁移可以分为跨任务迁移和跨领域迁移。本文主要以跨任务迁移作为研究重点,跨任务迁移学习相比单任务融合了任务间的共享信息,可以利用任务间联系提高学习数据分布特征的效果,更接近人脑认知过程。当前跨任务迁移学习过程可以划分为:1.任务信息获取、2.任务间信息融合。在模型提取任务信息阶段,发现当前跨任务迁移方法中未充分学习句中要素与要素关系的问题。之后,任务信息进行融合阶段,发现存在平等融合任务间关系加重任务间负迁移影响的问题。针对以上两个阶段存在的问题,本文从文本表示和任务间关系表示为切入点,主要内容有:1.针对文本表示的研究。近年来,为了缓解相关任务潜在特征相互制约的问题,提出多任务学习融合到序列标注中。多任务学习利用多个任务的潜层信息提升模型泛化能力并达到了关联特征提取的目的,但是忽略了文本序列间提供的重要信息。为了利用文本序列间的重要信息和关系,提出了一种构建要素与要素关系的多任务序列标注模型。该模型使用要素关系构建模块提取要素关系,更好地利用了语义表示和关系,并在公开数据集上验证取得了不错的效果。2.针对任务间关系的研究。多任务文本序列标注使用多任务学习方法提高文本标注效果,在自然语言处理中有广泛的应用。但现有方法普遍使用硬共享机制,存在未充分利用任务间关系以及缺少控制任务间负迁移的问题。为此提出一种基于迁移学习的多任务文本序列标注模型,该模型首先利用任务关系表示模块获取任务间潜层空间关系的抽象表示,然后构建基于特定任务特征融合模块实现过滤负影响信息和保留有利信息,然后进行信息融合以达到更好地抑制任务间负迁移的目的,进而提高模型的泛化能力。实验表明,该模型在数据集上的五个任务上超过业界前沿方法。综上所述,在本文提出的基于迁移学习的文本表示以及利用迁移学习的任务间关系融合到多任务表示中取得了较好的效果,并且在实验上证明了所提出理论方法的有效性。
其他文献
地铁环控系统能耗占地铁车站运行总能耗的1/3,因此,地铁车站环控系统的优化设计具有极大的节能意义。本文以某地铁车站空调系统节能控制项目为支撑,以该地铁车站空调系统为研究对象,利用Trnsys仿真软件对基于“最小水流量”的空调系统控制策略以及节能效果进行深入研究,此外还对风-水联动控制中优先风机法控制策略进行仿真模拟,对两种控制策略的运行效果和节能性进行对比研究,得出最优控制策略。首先介绍本课题依托
学位
随着我国生态文明建设的推进,绿色矿山逐渐成为了国内矿山建设的主流方向,边开采边治理的开发方案很快得到了矿山企业的积极响应。然而,有关绿色矿山景观规划设计的发展则相对迟缓,在对绿色矿山进行生态治理的同时,其景观效果欠缺的问题愈发凸显。近年来,笔者多次参与有关绿色矿山生态修复类的景观规划设计项目,在实践中积累了一定经验,在此基础上,提出本研究课题。本文研究内容共分为六大部分。第一部分,系统梳理了本课题
学位
船舶领域的快速发展带来巨大耗能,工业污染和海洋生态破坏等问题日益突出。推动船舶制造业的绿色转型升级,促进航运业的节能减排,已成为该行业的必然选择。船舶结构轻量化技术在实现船舶减重的同时,可提高结构承载能力,从而达到降低能耗、减少环境污染、节省成本的效果,开展该技术的研究已成为本行业转型升级中的重要环节。多层级点阵结构是轻量化结构研究热点之一,其内部设计为有规律的多孔结构,具有轻质、高刚度、高承载性
学位
开展水下螺旋桨噪声预报的研究,能辅助螺旋桨的设计优化以及提高舰船、潜艇等的声隐身性能,具有重要意义。目前展开的相关研究,一方面考虑空泡、声速、温度和深度等对辐射噪声的影响;另一方面着眼于螺旋桨与船体的耦合作用或距离螺旋桨几十公里之外的远场噪声预报等。据此,采用成本高昂的实验方法和长时间的理论分析都不理想,相比之下数值模拟方法成为最佳选择。但是,数值模拟也面临计算量大的难题,对此,高速发展的并行计算
学位
多模态任务的一个重要子任务是视觉问答。视觉问答任务要实现多模态的关联表示,将图片和与图片相关的问题作为模型的输入,通过模型得出问题答案作为输出。现有方法解决了一些问题,但也存在很多不足。现有模型中存在细粒度信息以及空间关系信息表示不充分的问题,还存在单模态的偏置问题和无效区域偏置融合问题,针对这些问题提出具体的模型,主要研究内容如下:(1)针对现有视觉问答模型中细粒度信息以及空间关系信息表示不充分
学位
对于水声工程而言,结构振动声辐射会产生水下噪声,破坏声隐身性能,对水下生物也有影响,因此对水声工程结构的减振降噪设计和振动控制尤为重要。当在振动模态空间中去研究声辐射时,会发现有的振动模态之间的声辐射相互耦合,这种声辐射耦合会使得结构的振动声辐射控制变得困难,如果可以不考虑耦合的话,那么只针对结构的振动模态进行控制就可以达到减振降噪的双重效果,因此对结构振动模态间声辐射的耦合强度和耦合关系的研究非
学位
目前,老龄化问题是我国面临的一大严峻挑战,根据2021年人口普查结果显示,当前我国属于轻度老龄化的状态。基于对未来社会的可预见性,老龄化问题会更加显著。随着人性化理念的渗入以及养老观念的变化,养老空间的人性化设计理念也在慢慢进入乡村敬老院规划布局当中,城市地区养老机构得到了飞速发展的同时,乡村地区的养老机构却发展缓慢。本文通过关注河南省商丘地区敬老院的建设,首先对课题的背景和国内外研究现状进行梳理
学位
在人工智能的图像识别领域,识别分类是各类任务的关键所在,准确判定物体类别是各类应用场景下的基本需求。近年来随着深度学习的不断发展,传统的深度学习图像分类方法能够在各个领域取得超过人类的识别正确率和速度。但是,要想取得预设的识别效果,就需要大规模的标注数据样本,并且保证训练集和测试集的样本类别一致。但在实际应用当中,某些类别的图像样本数据获取难度高,新增不可见类别的样本速度快等问题阻碍了图像分类的进
学位
粘性土是很多工程不可避免的地基土,其变形和强度被学者广泛关注。压缩指数Cc作为最常用的变形指标之一,常被用于评价土体变形、计算地基压缩变形。土体应力应变曲线是反映其变形和强度特性的重要依据,也是研究其力学本构关系、计算模型参数的数据基础。但由于原状土取样困难且很难开展变形试验,因此开展变形和强度的统计工作具有重要意义。针对粘性土的变形和强度指标预测的地域局限性、原状土变形试验难以开展、工程土体信息
学位
在智能驾驶技术中,交通标志的检测与识别至关重要。传统的算法模型,精度不高且满足不了实时性的要求。使用深度学习的方法构建交通标志检测与识别模型,使得其精度与速度都得到了极大的提高,但这仅限于在目标较大的时候,当交通标志作为小目标出现的时候检测准确率就大大下降。然而在真实的驾驶场景中,交通标志在图片中往往是以小目标的形式出现,本文中的研究工作致力于提升小目标的交通标志检测与识别的准确率。首先,提出了重
学位