基于句法的序列--序列模型增强方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:canoe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列-序列模型是人工智能领域(特别是自然语言处理领域)普遍使用的模型之一。这个模型能够使用一个统一的框架,直接将输入序列转化为输出序列。许多问题都能够转化为这种形式的问题,进而能够使用序列-序列模型进行求解。无论是机器翻译、句法分析还是语音识别,通过对问题的输入和输出的形式进行合理的变换,我们可以对众多问题得到一个统一的解法。另一方面,句法信息是计算语言学的一个重要的组成部分。许多研究已经证明了句法信息对于自然语言处理的重要性。因此,使用句法信息来提升模型的性能,是长期以来自然语言处理领域的研究者们的一个重要的问题。
  基于上述分析,本论文针对下面的问题进行了研究:使用句法信息增强序列一序列模型。序列-序列模型由编码器、注意力机制模块和解码器这三个部分组成,编码器和解码器的最底层都是词嵌入模块,而隐含层模块上方都可以通过添加输出模块的方法来引导隐含层的学习。因此,本论文研究了在以下三个模块通过句法信息的融合来提升序列-序列模型的性能:词嵌入模块、注意力机制模块、输出模块。同时,本论文对注意力机制的基本原理进行了分析,提出了一种全新的具有通用性的注意力机制。具体地,本论文进行了以下的研究工作。
  第一,在词嵌入模块,本论文提出了三种融合句法信息的方法。针对传统的基于句法的模型对句法分析器错误敏感的问题,本论文提出了面向压缩句法森林的编码方法。针对最新的基于Transformer的神经机器翻译系统,本论文提出了基于句法的位置编码方法,将句法结点的位置信息融入到词嵌入模块。针对句法树的线性化序列长度较长的缺点,本论文提出了基于神经句法距离的词嵌入模块增强方法。这三种方法能够从不同角度使用句法信息增强词嵌入模块。
  第二,在注意力机制模块,本论文提出了三种利用句法信息增强注意力机制的方法。确定性注意力机制的引入,使得基于序列-序列模型的句法分析器可以利用关于句法分析的语言学信息来指导模型的学习。基于句法的自注意力机制使用句法信息来约束Transformer中的注意力机制的模块。基于压缩句法森林的注意力机制,使得解码器能够根据句法树的质量确定句法树的权值,从而能够使用质量更好的上下文向量进行解码。
  第三,在隐含层的上方,通过增加一个额外的输出层的方式,本论文提出了一种使用句法信息提升隐含层质量的方法。在隐含层的上方额外增加的输出层可以预测出神经句法距离的序列。通过使用真实的神经句法距离来引导这个序列的学习,隐含层中就会融合句法信息,从而提升了隐含层的向量表示的质量。
  第四,本论文对序列-序列模型注意力机制的根本原理进行了研究。以机器翻译中的词对齐任务作为目标,通过比较使用了两种不同的神经网络的序列-序列模型效果的差异,本论文对序列-序列模型中的注意力机制提供了新的认识。此外,本论文提出了一种全新的公理化注意力机制,这种注意力机制可以应用于任何形式的序列-序列模型,与神经网络的具体结构无关。这种注意力机制模块能够很好地学习到词对齐信息。
  本论文的研究使得序列-序列模型能够充分地利用句法信息这一重要的语言学特征来提升模型的性能,这对于机器翻译、句法分析以及许多其他的自然语言处理任务都很有帮助。同时,本论文对注意力机制模型的探索能够为其他关于序列-序列模型的研究提供一些全新的认识。
其他文献
HgI探测器的性能关键是取决于材料本身和器件的制备工艺.因此该论文在生长了高纯、高阻、高质量的HgI单晶后,制备了HgI晶体器件,并研究了表面处理、老化,电极制备,封装等器件制备工艺对器件性能的影响.该文中采用"真空冷指升华法"制备基本组成原料高纯(6N)碘(I)及"三温区气相合成法"合成碘化汞(HgI)多晶原料,真空区域升华法提纯碘化汞,最后采用"三温区气相定点成核法"生长HgI晶体,通过化学计
学位
该论文以BaO-TiO系统为研究对象,分别对中温和低温BaO-TiO系统陶瓷的微观结构和介电性能进行了分析.利用电子陶瓷工艺,在系统中添加适量的ZnO、NbO、SnO和MnCO等物质,使烧结温度由高温降至中温1160℃,并且改善了系统的介电性能.为了使烧结温度进一步降低,以便采用较便宜的Ag电极或Pd含量较少的Pd/Ag合金电极,我们在中温系统中加入玻璃.适量玻璃的添加使烧结温度降至950℃.XR
学位
正交频分复用(OFDM)技术具有抗多径时延、抗信道衰落、频谱利用率高、硬件实现简单等优点,近年来受到广泛关注,但OFDM技术存在着两个主要缺点:对非线性问题敏感、对定时偏差和频率偏移敏感,如何克服这两个缺点是OFDM技术研究的主要方向之一,本文主要是研究正交频分复用技术中的定时偏差和频率偏移敏感问题即同步问题。本文首先介绍了OFDM技术的基本原理、特点以及多径信道特征等,然后对OFDM系统结构进行
该文用表面态和能带论的观点,系统地分析了气体在敏感膜表面吸附时造成表面功函数的变化以及器件的工作原理,同时全面考虑其它因素如晶界电势及吸附气体在敏感膜内的扩散等对响应过程的影响.实验中选用不同材料的复合配比及不同成膜工艺制作敏感膜.并采用双敏感膜结构,与不同类型IGFET组合,研制成检测ppb范围臭氧浓度的高灵敏度复合悬浮栅场效应晶体管(HSGFET)臭氧传感器.测量并比较了不同悬浮栅基片和不同敏
学位
该论文主要研究了LaAgMnO样品的物理特性,其主要内容介绍如下:二.LaAgMnO粉末样品成相过程的研究.通过对一系列LaAgMnO(x=0.05,0.15,0.25,0.35,0.45)多晶样品成相过程的分析,观察到LaAgMnO多晶的临界成相温度与样品的银含量有着密切的关系:银含量越高的样品成相所需的临界成相温度就越高.并且当银含量达到一定程度时会有革质银析出,我们认为这是因为银离子在溶胶-
学位
该文以Ba(MgTa)O(BMT)系微波介质陶瓷为主要研究对象,研究了Ma/Ta比的微量变化对BMT系陶瓷的结构和介电性能的影响.针对BMT烧结性能差,烧结温度偏高,介电常数的温度特性不好的热点问题,采用两种不同的烧结工艺制备BMT微波陶瓷.为了降低BMT系材料的烧结温度、改善温度特性,分别添加Ba(CoNb)O和NaF进行掺杂改性研究.在采用传统一步煅烧法制备的三组不同Mg/Ta比的BMT试样中
学位
MIMO 技术通过在接收端和发送端配置多根天线,可在不增加带宽和发射功率的前提下,成倍地提高系统的容量,显示出明显的优势,是未来无线通信的关键技术之一。然而,MIMO 系统中多个用户同时与基站交互数据,用户之间相互干扰,影响了通信质量,因此如何消减干扰是MIMO系统面临的关键问题之一。  本文研究了不同场景下已有的干扰消减方法,针对目前其设计方案存在的问题,提出了相应的改进方法。本文的主要工作如下
学位
第五代移动通信即将来临,要求数据速率提高100~1000倍,设备连接数提高10~100倍,对频谱效率和能量效率提出了更高的要求。由于非正交多址技术(Non-Orthogonal Multiple Access, NOMA)可以极大提高频谱效率,因此成为了下一代移动通信候选方案之一。但是数据量的急剧增长,也导致了极大的能量消耗。因此,绿色通信也是未来研究的重要趋势之一。基于以上研究背景,针对功率域N
频谱资源不受限制、设备成本低以及与现有无线电磁波通信互不干扰等特点使可见光通信成为扩充无线通信系统容量、提升通信覆盖率的一种重要候选技术。多输入多输出(Multiple-Input Multiple-Output, MIMO)技术对无线电磁波通信系统通信容量的大幅度提升为室内可见光通信系统传输方案的设计提供了重要的参考和借鉴,室内多光源布局的天然条件更加便利了MIMO技术在室内可见光通信系统中的应
近年来,我国逐步建成了防守型的海洋防御体系,海防雷达正发挥着越来越重要的作用。海防雷达的海表面目标检测(特别是海表面的小目标检测)技术,在军用和民用均有着重要的地位,它广泛地应用于海洋安全、海事救生、监控非法走私等领域。在各种检测方法中,对目标所在背景环境中的噪声及海杂波进行有效的处理十分重要,这直接影响目标检测的性能。而海面情况极其复杂,天气、浪涌等因素给目标检测带来了极大地困难和挑战,在复杂的
学位