论文部分内容阅读
语义解析旨在将人类使用的自然语言映射为一个完整的、计算机可执行的形式化意义表示。它是自然语言处理的核心研究领域,也是实现各种智能系统的关键技术,如面向知识库的自动问答、机器人动作控制等。英文上的语义解析研究经历了较长的历史,各种经典的语义解析方法已经被相继提出。特别地,随着神经网络的发展,基于LSTM神经网络的语义解析方法已经成为新的研究趋势。由于中文相比英文来说更加复杂,而且缺少针对中文语义解析的公开数据集,所以目前针对中文语义解析的研究相对较少。本文以面向知识库的自动问答作为应用场景,改进了现有的基于LSTM Encoder-Decoder的英文语义解析模型,并将其应用在中文语义解析任务上。本文主要的工作包括:(1)针对中文表达方式多样、语法灵活的特点,本文在现有的LSTM Encoder-Decoder语义解析模型中引入了自然语言的句法结构。本文在现有的Encoder中引入树形LSTM神经网络,并根据自然语言的句法树对其进行编码,减少中文表达方式多样性带来的影响。(2)本文改进了 Decoder的解析过程,改进的Decoder可以利用知识库提高语义解析的准确率,使得语义解析结果能够直接应用到面向知识库的自动问答场景中。(3)构造了一个中文语义解析数据集,弥补了中文自然语言语义解析缺少公开数据集的问题。其中,该数据集由自然语言句子和每个句子对应的意义表示组成,自然语言的意义表示使用lambda演算描述。(4)实现了本文改进的语义解析模型,并在本文构建的中文语义解析数据集上进行了实验。实验结果表明,本文所提出的改进模型,在前述的中文数据集上取得了更好的准确率。