融合目标端句法的AMR-to-Text生成

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wl349682847
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
抽象语义表示到文本(AMR-to-Text)生成的任务是给定AMR图,生成相同语义表示的文本.可以把此任务当作一个从源端AMR图到目标端句子的机器翻译任务.目前存在的一些方法都在探索如何更好地对图结构进行建模.然而,它们都存在一个未限定的问题,因为在生成阶段许多句法的决策并不受语义图的约束,从而忽略了句子内部潜藏的句法信息.为了明确考虑这一不足,该文提出一种直接而有效的方法,显式地在AMR-to-Text生成的任务中融入句法信息,并在Transformer和目前该任务最优性能的模型上进行了实验.实验结果表明,在现存的两份标准英文数据集LDC2015E86和LDC2017T10上,该方法取得了显著的性能提升.
其他文献
结合目前建筑物联网在实际使用过程中存在接口标准复杂、数据共享难、建筑物联网数据应用效率不高等应用落地难点,文章首先概述了物联网技术在建筑智能运维的使用现状,结合建筑运维管理的需求,分析了建筑物联网在建筑智能运维中的应用点,并以物联网应用项目探讨了建筑物联网数据在建筑运维智能化的应用模式.
绿色建筑首先需要控制的就是暖通空调的能耗.文章以绿色节能暖通空调技术的应用为切入点,探讨绿色建筑的节能措施,希望能为达到双碳目标贡献力量.
消防水泵的启动是消防水灭火系统最重要环节,如何有效启动消防泵,保障灭火的可靠性,规范给出了多重保障措施,既有泵房现场手动启动、机械应急启动,也有消防控制室远程启动,还有火灾自动报警系统联动编程启动,但对于屋顶消防水箱流量开关启动消防泵,一直有争议,文章通过高铁站工程实例探讨研究流量开关启动消防泵的不必要性.
随着科学技术的飞速发展,信息化铁路应运而生,电子客票代替了纸质车票,智能检票代替了人工检票,高铁代替了慢速列车,智能服务代替了传统服务,从里到外,从小到大全方位便捷了旅客的出行.
随着城市化的发展,民众对城市环境的要求在不断提高,现代化城市治理成为城市发展相关部门关注的焦点.数字化管理是现代技术发展的由来,尤其是信息技术应用的一种新模式,是不断发展和相关传统管理部件调查流程的重组,是建设的有益尝试.为了履行社会治理和服务的职能,消除城市治理中的信息鸿沟,积极推进数字城市部件调查.基于此,文章讨论了城市部件调查内容与方式,分析了城市部件数据采集方式,基于数字化测量和外业部件采集,全面提升部件调查及数据采集质量.
铁路物流中心占地面积大、功能分区多、用电设备多,电力设计比较复杂.本文结合工程设计实例,从负荷分级、变配电所、远动系统设置、站场照明及控制、防雷接地等方面进行阐述,以供类似工程项目参考.
文章深刻剖析了某油气企业办公楼智能化建设和管理使用现状,梳理其中存在的问题,指出新时期办公楼宇智能管控和高效运营的具体需求,并以此油气企业办公楼智能化管理系统建设为例,提出具体的技术解决方案,建立统一的技术性标准和规范.
关系分类作为构建结构化知识的重要一环,在自然语言处理领域备受关注.但在很多应用领域中(如医疗、金融等领域)收集充足的用于训练关系分类模型的数据十分困难.近年来,仅需要少量训练样本的小样本学习逐渐应用于关系分类研究中.该文对近期小样本关系分类模型与方法进行了系统的综述.根据度量方法的不同,将现有方法分为原型式和分布式两大类.根据是否利用额外信息,将模型分为预训练和非预训练两大类.此外,除了常规设定下的小样本学习,该文还梳理了跨领域和稀缺资源场景下的小样本学习,探讨了目前小样本关系分类方法的局限性,并分析了跨
机器翻译错误分析旨在找出机器译文中存在的错误,包括错误类型、错误分布等,它在机器翻译研究和应用中发挥着重要作用.该文将人工译后编辑与错误分析结合起来,对译后编辑操作进行错误标注,采用 自动标注和人工标注相结合的方法,构建了一个细粒度英汉机器翻译错误分析语料库,其中每一个标注样本包括源语言句子、机器译文、人工参考译文、译后编辑译文、词错误率和错误类型标注;标注的错误类型包括增词、漏词、错词、词序错误、未译和命名实体翻译错误等.标注的一致性检验表明了标注的有效性;对标注语料的统计分析结果能有效地指导机器翻译系
基于大规模语料训练的语言模型,在文本生成任务上取得了突出性能表现.然而研究发现,这类语言模型在受到扰动时可能会产生攻击性的文本.这种不确定的攻击性给语言模型的研究和实际使用带来了困难,为了避免风险,研究人员不得不选择不公开论文的语言模型.因此,如何自动评价语言模型的攻击性成为一项亟待解决的问题.针对该问题,该文提出了一种语言模型攻击性的自动评估方法.它分为诱导和评估两个阶段.在诱导阶段,基于即插即用可控文本生成技术,利用训练好的文本分类模型提供的梯度方向更新语言模型的激活层参数,增加生成的文本具有攻击性的