基于多编码器多解码器的大规模维汉神经网络机器翻译模型

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:kmweiran
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提升维汉机器翻译模型的翻译能力,该文提出使用多编码器多解码器的结构,搭建大规模的维汉神经网络机器翻译模型.相比于单编码器单解码器的浅层的小模型,多编码器多解码器模型具有多个编码器,可以对源语言进行多层次、多视角的压缩表示;同时具有多个解码器,可以增强目标语言的生成能力.实验证明,在大规模的训练数据上,使用该方法搭建的大规模维汉神经网络机器翻译模型,译文质量可以大幅度地超过基于短语的统计机器翻译模型和基本的神经网络翻译模型.该文还针对维汉翻译源端语言和目标端语言的翻译单元粒度进行了实验,发现维吾尔语端使用字节对编码单元、汉语端使用字单元,可以消除对汉语分词器的依赖,做到和双端都使用字节对编码单元可比的效果.
其他文献
bauma CHINA 2018将于2018年11月27-30日在上海新国际博览中心举办,参展报名工作正在火热进行中。bauma CHINA 2018报名工作开展近两个月,截至目前,已报名展商数量较上届增加
复杂网络是由大量互相联系的动力节点构成的耦合系统,其在互联网、全球经济市场、社交网络以及生态系统等诸多领域有着广泛的应用。复杂网络同步现象的研究具有十分重要的理论
阅读是语文之本,是托起学生语文能力和素养的最重要支柱。曾经有人向鲁迅学生请教过写作经验,他这样说:“哪能有什么经验,无非是多看了几本书罢了。”新一轮课改明确要求小学生必
近年来,关于如何协调一组分布式的动力学系统或个体已经成为多个体系统研究的一个热门领域。作为在多个体系统的分布式控制研究中的一个根本问题,多个体系统的一致性问题近来已
高中化学,对于理科生来讲是必须要面对的重要课程,毕竟将来高考是否能够顺利考上理想的大学和其有直接性的关系.在新的历史时期,教育也发生了重大的变化,如何提升高中化学课
2002年4月24日,中国电信集团全国光缆扩容DWDM/SDH系统工程配套传输网管项目通过竣工验收并被评为优良工程,现已正式投入使用。该项目是一级干线上的首例交钥匙工程,由国信朗
期刊
2004年2月中旬公布的《中国共产党党内监督条例(试行)》,这是中国共产党执政50多年来第一个全面地、系统地进行自我约束与促进自我发展的党内制度规范。令人耳目一新的是《条
学位
随着新课改的全面实施和逐步深入,初中数学教学也面临着一系列的改革要求.新课程标准中明确指出,初中数学老师在教学过程中除了要给学生传授相关的数学知识,还要注重培养学生