基于Transformer神经网络的无监督句法分析研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:Monkeysct
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前信息技术的增长速度正达到一个前所未有的高度,人们在享受信息技术带来的便利同时每天也会产生大量的数据,而如何从这些存在大量冗余的信息中挖掘出有效的信息已经成为了一个非常重要的问题。同时在这些数据中,文本信息数据是其中最常见也是最难以让计算机理解的信息,因此自然语言处理技术作为一个非常关键又非常具有挑战性的方向应运而生。在自然语言处理领域里,句法分析研究又是其中非常重要的一项基础任务,与计算机对于人类语言的理解程度息息相关。句法分析在许多下游任务中都有广泛的应用,如问答系统和情感分析等等。句法分析(该处指成分句法分析)是对于一个句子解析出其句法结构树结构的方法,目前大多数句法分析主要通过在解码模型上做出改进以提高效果且大多数方法都是基于有监督数据的方法。与目前的方法不同,本文在Transformer模型的基础上加入了对句法结构隐式建模的模块,从而在编码过程中加入了句子结构信息,同时基于还原词序的训练方式改进了模型的训练方式,使得模型具有更好的适应性以及更好的效果,本文的主要工作如下:(1)基于编码过程中加入句法信息的思想,对于无监督编码模型做了一定的改进,在多头自注意力层前加入了一个新的对句子中句法成分先验知识进行计算的模块——结构注意力层,这个计算出来的句法成分先验知识用于表示一段单词集合(顺序地包含两个或两个以上单词)能否构成一个短语。这个结构注意力层相当于对句子的结构进了隐式地建模,这本质上其实是针对性的加入了一个专门学习句法结构信息的模块,因此使得在计算词与词之间的相似性时将短语的结构信息,句子的结构信息都考虑进去了。(2)在原掩码语言模型训练的基础上对训练方式进行了改进,由于考虑到原来预测掩码词的训练方式与下游无监督句法分析任务的关联性不是特别大,因此加入了与句子结构信息更相关的还原词序训练方式,在训练前预先对一定的词组进行打乱的操作,最终让模型还原词组的正确顺序以提高模型的鲁棒性并在提升句法分析的效果的同时降低语言模型的困惑度。本文在该领域公开的权威数据集Chinese Tree Bank 9.0版本上进行了一系列实验,并采用无监督句法分析领域中广泛使用的困惑度以及准确率、召回率、F1值来作为对于模型性能的评价指标。通过实验结果可以说明,本文提出的方法相对于该领域内的常用方法相比,具有良好的性能,可以有效提高句法分析的效果。
其他文献
微量掺杂作为一种有效的氧载体改性方式近来被广泛研究,然而其反应动力学方面的研究相对较少。本文结合宏观反应动力学模型和密度泛函理论(DFT)计算,探究了低含量铜掺杂对化学链过程中甲烷还原铁基氧载体的反应动力学和碳形成的影响,并初步评估了低含量镧掺杂的动力学效应。与未掺杂的Fe-Zr氧载体相比,Cu掺杂使得原有氧载体的XRD衍射峰发生了轻微的红移,这表明Cu原子掺入引起了物质的晶格变化,2%Cu样品中
车辆的互联化、自治化、共享化和电动化推动了智能网联汽车(Intelligent Connected Vehicles,ICV)的出现,智能网联汽车为日常生活带来便利的同时,也面临着功能损坏、信息泄漏等一系列危害。传统的危害分析方法(如故障树等)只关注组件故障,忽略了组件之间异常交互对系统产生的影响,因此无法对复杂的嵌入式系统进行危害分析。为了解决这个问题,系统理论过程分析(System Theor
工况识别是实现生产过程稳定控制,提高产品质量和节能降耗的关键。在工业现场中,异常工况出现概率较低,类别不均衡现象广泛存在。同时热工时序数据还有多变量、大滞后、强耦合等特点,不均衡数据下的工况识别任务难度很大。针对上述问题,本文形成一种基于核策略与深度学习的不均衡分类算法,可有效解决复杂工业过程工况识别中的不均衡多变量时间序列分类的问题。本文算法主要分为两部分:第一部分是判别器部分,主要由基于核空间
柯萨奇病毒B3(Coxsackievirus B3,CVB3)属于微小RNA病毒科(Picornaviridae)肠道病毒属(Enterovirus),是引发多种疾病的病原体,如病毒性心肌炎(viral myocarditis)、无菌性脑膜炎(aseptic meningitis)及胰腺炎(pancreatitis)等。被CVB3感染的组织中会出现细胞坏死性破裂,这也是引起病理性炎症的主要原因。早
在这个万物互联的时代,由于无人机具备部署灵活、移动性强等优势,使其成为了物联网中不可或缺的重要组成部分。而随着5G时代的到来,移动用户对网络传输速度以及稳定性的要求不断提高。在一些用户数目激增的特定区域,例如大型演唱会、体育赛事现场,传统地面基站往往不堪重负,而增加基站的铺设又会大大增加运营商的成本,产生不必要的开销。此时利用无人机搭载微型蜂窝基站飞行在区域上空去辅助地面通信基站对用户提供网络服务
随着汽车产业的不断发展和人们经济水平的提高,汽车保有量持续增长,促使二手车行业规模扩大。目前,线上二手车平台逐渐成型,但无法保证人们安全、可靠且经济地选购到合适的汽车。二手车电商平台为用户提供的汽车信息较为基础,不包含汽车的实际驾驶性能说明,用户需要通过实地试驾来感受汽车的实际性能,没有一套通用的方法实现对汽车性能的评估和比较。针对上述问题,本文基于二手车设计了试驾性能评估系统,根据行驶数据远程实
癌症是威胁人类生存质量的主要因素之一。变异的细胞会不受控制地生长,当它们聚集成块时便形成了肿瘤。随着肿瘤区域中实体瘤的过度生长,远离血管的内部细胞中的氧气消耗量远远超出了其血液供应量,这就造成了肿瘤内的缺氧环境。而肿瘤细胞为了适应这一环境,会改变自身代谢甚至基因转录过程,从而满足生存需求。因此,利用肿瘤细胞中缺氧环境诱导的细胞内变化来对肿瘤细胞进行成像,对于肿瘤的诊断和后续治疗十分重要。迄今为止,
随着新能源装机规模逐年增加以及工业发展带来负荷特性变化,源-荷两端不平衡对电网安全稳定运行造成影响,对电网调峰及调频造成巨大压力。电池储能具有快速响应、易于控制与双向出力的特征,被广泛应用于调峰及调频场景。现阶段的储能应用多针对单一应用场景,而协同场景的运用对提升电网安全稳定运行能力、提升储能利用率以及提高运行收益具有重要意义。因此本文针对调峰调频协同场景,研究储能选型方法,综合考虑经济性与技术性
水凝胶因其良好的生物相容性和较高的含水性,在生物医学和无标记传感器领域展现出巨大的应用前景。然而,常规水凝胶的机械性能往往较差,从而限制了它们在实际生活中的进一步应用。目前,研究人员基于能量耗散机制提出了多种改善水凝胶机械性能的方法,如添加纳米颗粒交联剂、引入第二重水凝胶网络或设计拓扑结构水凝胶等。虽然这些方法能够有效增强水凝胶的机械性能,但这些水凝胶在达到溶胀平衡时其机械性能仍会大幅度降低,且在
随着电力物联网的快速发展,电力系统的组网规模不断扩大、结构特性日趋复杂,电网一次侧越来越多的传感和控制设备、二次侧越来越复杂的计算和决策设备与现代通信网络融为一体,形成了耦合程度越来越深的复杂电力信息物理系统(Cyber-Physical Power System,CPPS)。传统集中控制式CPPS模型已逐渐无法适应电网庞杂的数据规模及结构,建立更加符合工程实际的电力信息物理相依网络模型的意义更加