基于序列表示的成分句法分析

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:bascin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
成分句法分析是自然语言处理中一个重要的基础任务,最终目标就是分析出给定句子的短语结构句法树。目前主流的成分句法分析方法可以分为三类:一基于转移系统的方法,二基于动态规划的方法,三基于句法树序列化的方法。三种方法各有所长,方法一和方法三解码效率较高,但是牺牲了解码效果;方法二解码效果很好,但是造成了解码效率的低下。本文主要关注基于序列化的方法,探索如何更好地平衡成分句法分析模型的效果和效率。首先本文提出了一种基于中序遍历的成分句法树解码方法。按照中序遍历的顺序进行贪心解码,将原本动态规划方法的(!)时间复杂度降低到了(log),其中是输入句子的长度。中序遍历解码结合了基于前序遍历和后序遍历的解码方法的优点,在一定程度上可以进一步提升模型的效果。此外通过预测中序遍历的序列,还可以充分利用已经预测出来的历史决策信息,来提升后续序列预测的效果。实验表明,该方法效率高于动态规划方法,同时效果上有一定提升。其次本文提出了一种基于句法树左子结点序列化的解码方法。通过预测句法树中所有的左子结点,还原整棵句法树。一棵成分句法树的所有左子结点可以表示成和句子长度相等的一串整数序列。通过注意力机制和快速的局部归一化,解析器可以在很高的并行程度下预测出最终的成分句法树,时间复杂度(log)。最终实验结果表明,该方法可以用序列标注方法的高效率,达到和动态规划解码方法相同的最佳效果。最后本文提出了一种基于图神经网络的成分句法树结构表示方法。成分句法树的结点数和结构在预测前是未知的,难以用图神经网络进行建模。而利用第二个工作中提出的序列表示方法,可以忽略成分句法树的非叶子结点,对所有叶子结点构建一个近似的全连接图。然后使用图注意力网络对这个图进行编码,增强结点的表示。最终实验结果证明,利用图神经网络可以很好的编码相邻短语之间的连接关系,进一步提升模型效果,并最终超越了传统的动态规划解码方法。
其他文献
研究目的:探寻脑卒中并发脑心综合征相关的危险因素,并构建脑心综合征风险预测模型,为临床筛选脑心综合征高危人群提供评估工具。研究方法:(1)回顾性建模:收集2018年6月至12月国内4家三级甲等医院318例脑卒中患者病历资料进行回顾性分析及建模。根据患者是否发生脑心综合征分为脑心综合征组和非脑心综合征组,采用logistic回归进行危险因素分析,构建风险预测模型、简易风险评估量表。(2)前瞻性验证:
国有农用地基准地价评估是扩大国有土地有偿使用范围、推动国有农用地规范有序流转、建立城乡统一的土地市场的重要环节。国有农用地作为我国土地的一种特殊形态,具有与集体农用地不同的土地特点,目前我国尚未出台针对国有农用地基准地价评估的技术规程。由于国有农用地的特殊性,常用估价方法在国有农用地基准地价评估中存在一定问题,基于此,本文以茂南区国有农用地基准地价评估为例进行国有农用地价格评估和实践研究。本论文研
改革开放以来,在经济快速发展的同时,我国的城市化进程明显加快,基础设施建设逐步完善。近年来,随着城市轨道交通基础设施建设的稳步推进,城市轨道交通路网的不断扩大,城市轨道交通项目的正外部效应不断增大,对城市经济发展起到了重要作用,推进了城市化发展。PPP(公私合作)模式由于其具有振兴市场资本,释放市场经济活力,缓解政府部门财政压力的特点,被广泛应用于城市轨道交通基础设施建设。然而,在城市轨道交通基础
在对科学和工程问题进行数学建模时,时变非线性方程组越来越受到科学家和工程师的关注和青睐,它通常被应用于机器人学、机械手的运动控制、混沌系统和多维谱估计等多个领域。因此,求解时变非线性方程组在科学和工程中起着至关重要的作用.然而在求解过程中,时变非线性方程组与时不变非线性方程组一样,也会受到奇异问题的考验.本文主要以零化神经网络(ZNN)求解时变非线性方程组的方法为基础,结合时不变方程组和微分方程组
大数据、人工智能及云计算、边缘计算等技术正在向嵌入式方向发展,并且在物联网(Internet of Things,Io T)和工业物联网(Industrial Internet of Things,IIo T)中,嵌入式系统已经有大量的应用。这对于嵌入式系统的存储器提出了更多的要求,未来嵌入式系统应满足更高的时间和能耗的要求。磁畴壁存储器(Domain Wall Memory,DWM)具有低访问延
针对快递运输市场中高铁与航空的竞合问题,构建高铁与航空快递运输竞合Lotka-Volterra模型,以京沪OD为例分析两者竞合关系、发展趋势以及演化趋势,为高铁与航空快递运输发展策略研究提供参考。结果表明:2014—2022年高铁快递与航空快递年均增长率分别为0.263 41,0.241 90,均呈增速发展;高铁发展现状对高铁快递发展的影响系数为-0.000 99,表现为促进作用,航空发展现状对航
随着软件的发展,软件的安全问题已经受到了工业界的关注和担忧。软件验证正是其中一种可以检查软件安全的方法。近年来,由于对软件安全需求的迫切性,大量的软件验证算法被研究人员提出,用来验证软件是否满足相关性质。可惜的是,由于软件验证算法的复杂,又缺乏统一的度量标准来提供给软件安全从业者选择合适的验证算法。如何为软件安全从业者提供合适的验证算法成为了软件验证领域迫切解决的问题。软件验证算法的自动化推荐成为
有机染料在自聚集的过程中,由于表现出优良的荧光特性,因此吸引了研究者浓厚的兴趣。例如发光二极管、光学传感器、聚集诱导发光的AIEgens非线性光学效应的纳米晶体用于超深体内生物成像、催化方面等。在聚集诱导荧光增强的有机染料聚集体中引入阴离子或阳离子,基于离子对其荧光现象的影响作为新型荧光探针工具,用于分析各活性物种在细胞、组织和活体中的分布、转运、变化和相互作用规律。本论文研究了含萘羟基-亚氨基片
当下最热门的教育话题就是"双减"工作的实施,带来最显著的变化就是体育学科得到了空前重视,小学体育课时从原来的"3+2" "4+2"模式全部变成"5+2"模式,如何随着课时增加真正做到"提质增效"值得思考与研究。文件实施以来,本人围绕"提质增效"就所任教年级进行了以下实践与探索,并引发了些许经验及思考:"5+2"模式为小学体育教学"提质增效"提供保证—是为教学"多元渗透"提供了保证。小学体育实
期刊
依托试验工程,对公路高填方路基大孔径钢波纹管涵洞管外径向土压力进行测试,得出钢波纹管涵洞管外不同角度土压力值随填土高度增加的变化规律,并得到以下结论:随着填土高度的不断增加,钢波纹管涵洞管外各角度土压力值逐渐增大,分为波动增长→快速增长→缓慢增长3个变化过程;填土后期,钢波纹管与周围土体形成土拱效应,土压力不再增长;管周90°、270°和管底180°位置出现应力集中,但最大应变值小于钢材的允许应变