论文部分内容阅读
序列标注是自然语言处理和机器学习领域中的一项重要的基础性工作,是近年来的一个研究热点。本论文研究序列标注中的神经网络方法,具有理论意义和应用价值。 论文的主要工作和创新点归纳如下: 1、提出了一种基于多层感知机的序列解码方法 该方法首先将词、词性和标签信息用预训练的实值向量表示,然后引入前词的标签信息,在解码时利用柱搜索方法,在一定程度上捕捉标签之间的依赖关系。在汉语和英语范畴标注任务上的实验表明,该方法有效提高了范畴标注的准确率。 2、提出了一种动态窗口序列标注模型 多层感知机需要用固定窗口来获取上下文特征,但是窗口的大小不易选取,且不同的词所需要的窗口信息也可能不同,本文设计了动态窗口模型来解决这一问题。该模型借鉴长效短期记忆(LSTM)网络中的门机制,通过设计的过滤门来动态提取上下文窗口中的信息,利用基于位置的注意力机制聚焦窗口内容。实验表明,该模型可有效提升现有神经网络方法在范畴标注任务上的性能。 3、提出了一种跨层堆叠的双向长效短期记忆标注模型 该模型针对层数过深会导致网络难以训练的问题,借鉴残差网络的思想,引入了跨层连接方法以加速收敛,并提出了在双向网络上三种基本的跨层连接方式,以寻找最优传输通道。此外,针对跨层连接会带来额外的迭代计算开销的问题,设计了一种跨层模块来优化跨层的信息传输结构,把长效短期记忆网络细胞模块中的自连接部分用跨层连接替代,因此无需保留自连接部分,从而降低了迭代计算开销。在范畴标注和词性标注任务上证实了跨层模块的性能要好于普通的跨层连接,并且在范畴标注任务上达到了目前的最好水平。