融合EMD最小化双语词典的汉—越无监督神经机器翻译

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:tanya_33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经机器翻译在平行语料充足的任务中能取得很好的效果,然而对于资源稀缺型语种的翻译任务则往往效果不佳。汉语和越南语之间没有大规模的平行语料库,在这项翻译任务中,该文探索只使用容易获得的汉语和越南语单语语料,通过挖掘单语语料中词级别的跨语言信息,融合到无监督翻译模型中提升翻译性能;该文提出了融合EMD(Earth Mover’s Distance)最小化双语词典的汉—越无监督神经机器翻译方法,首先分别训练汉语和越南语的单语词嵌入,通过最小化它们的EMD训练得到汉越双语词典,然后再将该词典作为种子词典训练汉越双
其他文献
根据265 mm厚S500Q-Z35钢板的化学成分,评估冷裂敏感性和再热裂倾向,并对钢板进行Z向窗形层状撕裂试验和T型接头模拟件焊接试验,试验未发现裂纹。按美国ASME标准进行焊接工艺
“一带一路”能源命运共同体战略构想是我国基于人类命运共同体理念,为全球能源治理体系重构提出的一种可行性方案.中亚地区是我国“一带一路”油气合作的核心区域,我国在与
系统梳理海南电网2015~2018年间水电、风电、光伏发电的建设与发展情况.海南陆域水能资源理论蕴藏量为104×104kW,技术可开发量为95× 104kW.2018年底,水电装机达到154×104kW
员工满意是客户满意的基础。以关系为导向的4R’s理论给知识型员工管理提供了新的视角。本文首先论述了4R’s理论应用到员工管理中的可行性,然后从关联、反应、关系和回报四
新冠疫情给我国海上风电发展带来巨大冲击.我国海上风电历经十余年沉淀,已不断夯实高质量发展基础,但也暴露出一些短板,并在疫情“催化”作用下显现.目前海上风电面临补贴加
新冠疫情的暴发给全球能源产业的发展带来很大的不确定性,但同时也推动了全球能源格局的演进和重塑.新冠疫情加速了全球能源结构调整,推动世界能源结构向天然气和新能源等低
随着葡萄花油田注水开发的不断深入,为实现注采不完善储层内剩余油的有效挖潜,采用油井压裂驱油工艺,以压裂方式注入大量适宜浓度的地层驱油液,在补充地层能量的同时实现剩余
海外油气资产并购是国家能源安全的关键环节,应用测井技术发现上述并购交易存在的隐患与包装假象,是趋利避害的重要方式,但测井技术的应用常面临两大挑战,一是怎样从有限测井
循环流化床锅炉作为高效清洁燃烧技术,具有广泛的应用前景,但磨损泄漏一直是困扰循环流化床锅炉长周期运行的一大技术难题.燕山石化DG410/12.7-Ⅱ1循环流化床锅炉于2014年投
通过分析伺服驱动辊锻机的工作原理和结构特点,用建模软件搭建三维模型,采用整体施加载荷、各零件单独分析的静力学分析方法,利用仿真软件模拟250 mm伺服驱动辊锻机整体模型