基于LSTM神经网络的中文语义解析技术研究

来源 :东南大学 | 被引量 : 13次 | 上传用户:qweaz1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义解析旨在将人类使用的自然语言映射为一个完整的、计算机可执行的形式化意义表示。它是自然语言处理的核心研究领域,也是实现各种智能系统的关键技术,如面向知识库的自动问答、机器人动作控制等。英文上的语义解析研究经历了较长的历史,各种经典的语义解析方法已经被相继提出。特别地,随着神经网络的发展,基于LSTM神经网络的语义解析方法已经成为新的研究趋势。由于中文相比英文来说更加复杂,而且缺少针对中文语义解析的公开数据集,所以目前针对中文语义解析的研究相对较少。本文以面向知识库的自动问答作为应用场景,改进了现有的基于LSTM Encoder-Decoder的英文语义解析模型,并将其应用在中文语义解析任务上。本文主要的工作包括:(1)针对中文表达方式多样、语法灵活的特点,本文在现有的LSTM Encoder-Decoder语义解析模型中引入了自然语言的句法结构。本文在现有的Encoder中引入树形LSTM神经网络,并根据自然语言的句法树对其进行编码,减少中文表达方式多样性带来的影响。(2)本文改进了 Decoder的解析过程,改进的Decoder可以利用知识库提高语义解析的准确率,使得语义解析结果能够直接应用到面向知识库的自动问答场景中。(3)构造了一个中文语义解析数据集,弥补了中文自然语言语义解析缺少公开数据集的问题。其中,该数据集由自然语言句子和每个句子对应的意义表示组成,自然语言的意义表示使用lambda演算描述。(4)实现了本文改进的语义解析模型,并在本文构建的中文语义解析数据集上进行了实验。实验结果表明,本文所提出的改进模型,在前述的中文数据集上取得了更好的准确率。
其他文献
随着内地A股市场日趋火热,沪港通资金正跑步入场。港交所披露数据显示,自3月12日以来,北向资金较前一周近乎倍增。$$ 数据显示,3月17日,沪股通资金使用额度超过20亿,是3月以来的
报纸
<正> 长期以来,医学界对类风湿性关节炎是否合并心脏损害的问题存在异议,作者拟就其历史沿革、病理和临床表现以及诊治等问题作一简要的综述。一、历史沿革 1836年Boullaud首
<正>传统的英语课堂,师生之间要么没有交流而成为教师的"满堂灌"或"一言堂",要么师生之间的交流随意而毫无目的,达不到教学目的。新课程标准下,英语课堂应追求有效性,注重与
<正>刘国辉:你们可能一开始会觉得"哎哟,他们那个笔墨怎么这样的……",是吧?肯定会这样说。你们没看到他们的精髓,里边的一些东西。所以从这个方面讲,我觉得整个中国人物画都
USB2.0接口因为其高速和热插拔特性在现代消费类电子接口技术上有着广泛的应用。根据接收的数据恢复数据和时钟,提供给数字系统一个精准的一个低抖动、与工艺无关数据时钟在
成本会计是一门理论与实践结合程度较高的课程。在素质教育被提倡的今天,本科应用型人才的培养不仅强调知识和品德的培养,更要注重对学生社会责任感、创新精神和实践能力的培
兵者,国之大事。在我们党领导民族复兴的伟大进程中,特别在当前国际国内形势发生深刻变化的情况下,建设巩固国防和强大军队,关系国家和民族的前途命运。习主席提出建设一支听党指
报纸
人,作为教育之本,是教育的出发点和归宿点。美术教育是一门副课,但它对教育人带来的作用并不是"副",它对培养学生的创造性思维尤其重要。因为创造性思维正是素质教育极其重要
<正>游戏是幼儿最喜爱的活动,深受幼儿的喜爱,也是教师对幼儿进行教育的重要途径,对幼儿的全面发展具有独特的作用。笔者根据多年的幼儿教育教学实践经验,对当前幼儿游戏教育