基于深度学习的依存句法分析器的设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zhshp123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的发展,自然语言处理技术得到了很好的研究,其中利用依存语法进行句法分析就是自然语言处理的重要手段之一。相比于短语结构分析,它的优点是只考虑词语之间的依存关系,是基于词法理论的。依存分析是自然语言理解的重要中间环节,它是许多自然语言处理任务的基础。围绕这一问题研究人员提出了不同的理论和模型。本文利用深度学习设计和实现了一个依存句法分析器。该分析器主要用于用户训练依存分析模型,以及使用模型对句子进行依存关系分析。论文简要的介绍了课题的研究背景、国内外现状,整理有关依存句法分析的基本知识,对论文中使用到的深度学习相关的技术作了简单介绍。通过对依存分析器的需求分析,设计了数据的预处理模块、构建和训练模型模块、解析和输出模块。其中主要实现了一种的指针网络的依存句法分析器模型,并且对该指针网络进行了优化,介绍并使用了一种新颖且简单高效的转换系统,该方法具有分类目标较少,转移序列较短的优点。同时利用对比学习实现全局归一化,该技术被证实在多项自然语言处理的序列任务中都起到了关键的作用,训练时采用的层次化、提前更新训练策略。在论文的最后,从多个方面对本次实验项目展开了详细的展示和分析,为用户使用该分析器提供了参考。考察了多头注意力对模型的影响,同时将全局归一化和局部归一化作了对比分析,训练策略对模型的影响,以及分析了束搜索的大小对全局归一化的影响。最终本模型在训练语料上的UAS值为86.85%,LAS值为85.45%,RA值为84.58%。
其他文献
党的十九届四中全会对推动国家治理体系和治理能力现代化作出了战略部署。湖北省委指出,十九届四中全会的召开标志着国家治理体系和治理能力现代化进入了全新的发展阶段。湖北省各级必须要坚决贯彻落实党的十九届四中全会精神,推动湖北省治理现代化,特别是要加强对于湖北省基层社会治理的创新,从而不断完善当前各项治理体系机制,保障人民群众切身利益。在推进治理体系和治理能力现代化的时代背景下,恩施作为湖北省西部重点经济
学位
目的:探究中老年人群中胆结石与非酒精性脂肪肝(Nonalcoholic fatty liver disease,NAFLD)发病的关联性以及性别差异,为胆结石患者预防NAFLD的发生提供一定的理论依据。方法:本研究依托“东风-同济”前瞻性队列,于2008-2010年调查了27009名研究对象。通过半结构化问卷询问其社会人口学及生活方式等方面的信息,通过医院记录收集其身高、体重、生化指标及B超等资料
学位
乙烯装置开停车过程涉及的流程长、操作复杂,整个装置处于非稳态运行,容易发生运行故障和事故。为保证装置开停车的安全顺利进行,因工艺、设备的运行原因很难避免火炬的排放,物料排放火炬燃烧过程中,会产生大量的一氧化碳、二氧化碳、氮氧化物、不完全燃烧的有机化合物等,对空气质量产生重要的影响。如何最优化开停车,降低物料排放,降低开停车成本,减小对环境的不良影响对乙烯装置意义重大。本文通过分析乙烯装置低排放开停
学位
农村集体产权制度改革是党中央、国务院进一步深化农村改革、推进乡村振兴、维护农民权益作出的重大决策。改革面临的政策性强、涉及面广、情况复杂,县域政府直面群众的矛盾和问题,是改革最主要的执行者。本文以云梦县农村集体产权制度改革实践过程为研究对象,从县域政府政策执行角度,深入分析了云梦县在执行农村集体产权制度改革政策的组织实施步骤、改革过程中的矛盾冲突和化解、改革成效,总结了改革的困难和问题,提出了进一
学位
目的:回顾性分析我院妊娠滋养细胞肿瘤(GTN)临床资料,了解妊娠滋养细胞肿瘤的临床特点、诊治方法及治疗结局。方法:回顾性收集2008年1月-2018年12月因妊娠滋养细胞肿瘤(仅包含侵蚀性葡萄胎及绒癌)在本院妇产科住院患者的临床资料,分析妊娠滋养细胞肿瘤的临床特点、诊治方法及治疗结局。结果:共纳入152例GTN患者,侵蚀性葡萄胎129例,绒癌23例。患者年龄15-54岁,以20-29岁的女性多见,
学位
目的比较Multiloc髓内钉内固定和解剖锁定钢板内固定治疗老年肱骨近端骨折的临床疗效。方法回顾性分析2016年9月-2019年5月在武汉协和医院骨科住院手术治疗并且病例资料完整的三部分和四部分老年肱骨近端骨折患者共89例。所有患者均为闭合性单侧肱骨近端骨折,且均为老年(大于65岁)患者。所有患者无合并严重影响骨折愈合的基础疾病。按照内固定方式分为髓内钉治疗和钢板治疗两组。平均随访时间(13.4±
学位
在数据挖掘领域,数据缺失是一个不可避免的问题,随着信息技术的迅速发展,研究者往往需要处理一些高阶高维、多元关联数据集,相应的数据缺失问题也越来越棘手。张量作为高维数据最自然的表达形式,非常适合用于高阶高维数据建模,一系列张量补全算法在图像填补、连接预测、推荐算法、交通数据填补等任务上表现优异。然而,即便是面对多源数据,现有的张量补全算法只能处理单一数据,在数据及其稀疏、冷启动场景下表现非常差。所以
学位
目的:铁依赖的铁死亡作为一种新近鉴定的死亡形式,广泛参与到神经退行性疾病、缺血-再灌注性损伤、肿瘤耐药等病理生理过程。2型糖尿病(type 2diabetes mellitus,T2DM)常继发铁代谢紊乱甚至胰腺铁沉积,提示铁死亡的可能。本研究旨在探究T2DM背景下胰岛β细胞的铁死亡及其对胰岛功能的影响,分析具有良好抗糖尿病效应的天然植物化学物槲皮素在此过程中的保护效应。方法:动物实验:SPF级成
学位
电能作为当今世界文化、经济、科技领域进步的基石,是社会的热点问题,世界各国都专注于研发新能源并提高电能的利用效率。而受限于电池容量,电能不能大量存储,为避免电能浪费,尽可能准确地预测未来的用电需求是高效利用电能的有效措施。目前预测电力需求值大多采用灰色预测算法、神经网络算法和支持向量机算法。灰色预测算法不能处理离散型数据和大幅波动的数据,神经网络算法容易取得局部最优值和过拟合,支持向量机的高算法复
学位
基于即插即成像(Plug and Imaging,PnI)的数字正电子发射断层显像(Positron Emission Tomography,PET)探测平台是基于全数字PET技术基础和核心器件发展出来的一个应用适应性新型PET系统开发平台,它能够帮助研究开发人员快速和便捷地搭建新型PET系统,并开展相关的硬件及软件研究。它具有全数字精确采样、硬件极小化软件极大化、系统结构灵活等特点,只用数字PE
学位