面向服务机器人自然语言交互的语义解析方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:firexuan1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
服务机器人需要直接与人类沟通并为人类提供服务,因此人机交互模块在服务机器人中具有重要的地位。为了提升用户满意度,自然语言交互的方式是目前人机交互的主流研究方向。语义解析作为自然语言交互模块中的一个任务,旨在将自然语言语句直接转化成语义完整的、计算机可执行的意义表示。语义解析的研究已经有较长的历史,从早期基于手工规则和模板匹配的方法,到基于训练数据的统计学习方法,再到深度学习模型方法,以及为了不标注数据而结合强化学习的弱监督方法,这些方法都体现出了各自的优势和缺点。本文针对语义解析数据标注困难、数据集规模小、深度学习模型难以发挥潜力的问题,从不同的角度提出了两个模型。第一个模型是结合句法知识的Tree2Tree模型,通过对句法分析得到的句法成分树进行编码,将句法视为先验知识引入到模型中,从而提升模型对自然语言的编码能力。另外,Tree2Tree模型采用树解码器进行层次解码得到逻辑形式,可以保证逻辑形式的语法正确性。第二个模型是基于预训练语言模型和知识蒸馏的语义解析模型,利用大规模预训练模型中含有的通用语义知识来完成语义解析任务。虽然预训练模型在语义解析任务上微调后可以得到较高的准确率,但其规模过大导致难以嵌入到服务机器人中。因此本文采用知识蒸馏的训练方法,将预训练模型中学到的通用知识和领域知识迁移到小规模模型中,从而可以得到一个准确率有明显提升的轻量级语义解析模型。本文介绍和实现了上述的两种语义解析模型,并在机器人指令语义解析数据集GPSR和另外两个公开数据集ATIS和GEO上进行了实验。实验结果表明本文提出的两个模型分别从不同的角度缓解了语义解析数据量不足的问题。在不增加训练数据的前提下,两种方法都能有效提升语义解析的准确率。
其他文献
学位
内蒙古油画艺术的发展要保持内蒙古的民族特色,要求内蒙古的油画艺术家们坚持自己的创作动机,创作活动不受干扰,真诚的表达真实情感,摹仿独特的地域特色,使内蒙古的油画艺术具有鲜
本试验对樱桃番茄穴盘育苗的不同基质(草炭、蛭石、介质202)及不同的种子处理方法(清水、海洋鱼蛋白浸种)进行试验比较,结果表明,草炭和蛭石的配方育苗,樱桃番茄秧苗的生长状
邓小平历次南方视察时都有重要谈话,其中蕴涵着辩证速度、台阶式、全面、和谐、以人为先和重民生的科学发展思想,这六方面发展思想对二十年后的发展新形势有着针对性的启示。
目的:探讨CISS分型与小卒中患者进展、死亡、复发的相关性。方法:神经内科2010年1月至2012年01月住院患者,选取NIHSS评分〈4分且头CT或MRI明确诊断为急性缺血性卒中患者(发病时
今年恰逢邓小平南方谈话发表二十周年,以此为契机重新回顾和挖掘这次谈话的重要精神仍然具有重要的价值。邓小平开创了中国发展模式的实践并且率先提出了中国发展模式的论题,
在以往十年中,第二语言的教学也许存在着两种主要倾向。第一种倾向涉及认知问题,即成功的语言学习不仅仅取决于好的教材和好的施教,而且还有赖于学习者所采用的一般与各别的
地方理工科院校应用物理学专业目前处于发展的困境,主要表现在生源质量较差,培养条件落后、培养模式单一和就业率低.要摆脱当前的困境,必须以经济社会发展对人才的需求为导向
近日,政商关系的话题又因柳传志而起。柳传志表示,企业较大的挑战在外部环境。创业初期他曾花费很多精力在适应和应付外界环境上,为了保证企业能够安全运行,努力创造一个适合企业
报纸
<正> 汉代是我国历史上国力强盛、疆域辽阔、经济繁荣的时代。在学术与文艺方面上承先秦,不同地区的文化兼收并蓄,并开时代之新风,创造出举世瞩目的、对中华传统文化的发展产
期刊