基于语法的双层编码器解码器语义解析研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:wangxiaofengkobe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今世界上大量的信息存储在结构化和半结构化的知识库中,对其进行查询的高效、简单的方法必不可少,方法不能仅限于拥有查询语言专业知识的人使用。语义解析领域涉及到将自然语言语句转换成计算机可执行的逻辑形式。借助于语义解析,人们可以不借助于专家,直接通过语义解析器将自然语言语句转换为逻辑形式,并对知识库进行查询。语义解析的发展历经三个阶段,基于规则模型、基于统计的学习模型、基于神经网络模型,每一阶段相较于上一阶段,对专家的依赖程度降低。基于编码器-解码器架构的seq2seq模型是基于神经网络的模型。部分模型引入抽象语法树,将意义表示的语法先验融入遍历抽象语法树而转换成的操作序列中,相较于处理意义表示时将其当做序列的模型,该转换使得待生成的序列长度变长,导致模型准确率降低。针对以上问题,提出了基于语法的双层编码器解码器系统(Grammar Constrained Double Layer encoder decoder system,简称GCDL enc-dec system)。主要工作包括以下两部分:第一部分,为了引入语法先验,保证模型生成意义表示合法,构建了GCDL enc-dec系统中的语法模型和转移系统。语法模型实现了意义表示与树的转换,转移系统实现了树与操作序列的转化。通过上述转换将语法先验融入操作序列,将生成意义表示转换为生成操作序列。第二部分,构建了GCDL enc-dec系统中GCDL enc-dec模型,将意义表示的生成过程分解为两个过程,第一层编码器解码器对文本编码,生成抽象概要树操作序列,第二层编码器解码器对上一层的结果进行编码并融合第一层的编码信息,生成抽象语法树序列。GCDL enc-dec模型通过双层结构,首先生成复杂度较低概要树序列,然后生成最终的抽象语法树。语法模型、转移系统、GCDL enc-dec模型组成了GCDLenc-dec系统。实验结果表明,GCDL enc-dec系统在语义解析、代码生成等数据集上的准确率、BLEU分数均有提高,证明了系统的有效性。
其他文献
随着国家不断推行相关政策及措施促进社会资本进入医疗市场,民营医疗服务机构发展迅猛,在数量上早已超越公立医疗机构,竞争也日益激烈。近年来,医疗行业的并购案例时常发生,企业为了快速地增加市场份额,增强核心竞争力,吸纳更好的资源,会选择以并购的方式来达成战略目标。然而,并购效果的成功与否,关键在于企业能否把优质的资源进行整合,发挥规模经济效应,实现“1+1>2”的协同效应,推动企业快速发展。并购整合通常
学位
汝窑在北宋晚期作为御窑,专为宫廷烧造瓷器,作为宋代五大名窑之一,与官、哥、钧、定诸窑齐名于世。汝窑器胎骨薄坚,釉色莹润,产品造型庄重大方,釉面开片密布,隐若蟹爪、鱼子、冰裂纹。其色有天青、粉青、天蓝、月白等,尤以天青为贵。汝窑的窑址过去不明,直到20世纪80年代,才在河南宝丰清凉寺被发现,明确了这个窑口的位置。由于烧造时间短促,汝窑传世品稀少,弥足珍贵,故为后世谈瓷者所津津乐道。长期以来,对汝窑的
期刊
肝胆手术随着精准理念及微创技术的推广普及,加速康复外科(enhanced recovery after surgery,ERAS)理念及路径在肝胆外科得到了越来越广泛的应用。近年来的临床实践表明,肝胆外科围术期实施ERAS安全有效[1]。ERAS促进了多学科团队的协作,提高了肝胆手术的安全性,也极大改善了患者对手术过程的体验,康复质量和速度均具有显著提高。然而,肝胆外科手术操作复杂,具有技术
胰腺手术胰腺切除手术主要包括胰十二指肠切除术(pancreatocoduodenectomy,PD)及胰体尾切除术(distal pancreatectomy,DP)两大类,其中PD作为腹部外科最为复杂的术式之一,存在手术时间长、并发症发生率高、术后恢复慢等客观因素; DP因不涉及消化道重建,在术式复杂性及患者术后康复等方面与前者差异较大。尽管20余年来加速康复外科(enhanced rec
城市和人一样,都有自己的属性。观一座城,好比识一个人。如果说,上海是时尚的、北京是大气的、成都是闲适的、西安是豪放的——那么,重庆便是江湖的!江湖的本意,是指广阔的江河、湖泊。在我们读过的那些武侠小说中,江湖,指代的是远离统治阶层、不被当权控制、不受法律约束的民间社会。那江湖是草莽英雄们的世界,它不同于朝堂,但同样也有自己的规则,那是一套以"道义"替代"法律"的规则,有时过于主观、难免偏颇,
期刊