基于神经网络的蒙汉机器翻译研究

来源 :内蒙古师范大学 | 被引量 : 0次 | 上传用户:heruoss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息交流需求的增加及国家民族地区稳定的需求,蒙汉机器翻译的研究及应用迫在眉睫。蒙汉机器翻译的研究对推动内蒙古自治区的信息化,促进自治区社会进步和经济发展,繁荣和发展少数民族文化教育科技事业有着重要的意义。近年来神经机器翻译取得迅速发展,已经取代统计机器翻译成为新的主流技术。针对蒙古语言自身特征,结合机器翻译的最新方法,本文开展了基于神经网络的蒙汉机器翻译研究,主要做了以下几个方面的工作。(1)利用Tensor Flow搭建了蒙汉端到端神经机器翻译系统。该系统的框架为“编码器-解码器”框架,其中编码器和解码器都使用循环神经网络。然后在该系统上做了词级别的蒙汉机器翻译实验,其最优的评测结果的NIST值和BLEU值分别为8.9223和0.6067。(2)常规神经机器翻译模型使用固定大小的词汇表,蒙古语是黏着性语言,其形态变化丰富,存在词根相同的名词和动词的许多变形形式,表示相似的概念,相同词根的不同变形形式被训练成不同的单元,从而增加了神经机器翻译的词汇词典的规模。为了权衡蒙古文形态丰富的特点和神经机器翻译的词汇表受限问题,本文采用短语翻译和CRF相结合的统计切分方法来切分蒙古文。首先采用基于短语的统计机器翻译模型切分蒙古文词,然后采用条件随机场模型来切分未登录词。(3)切分蒙古文后,将蒙古文词干、构形附加成分和分写附加成分等形态信息融入到蒙汉神经机器翻译中,研究了基于词素的蒙汉神经机器翻译。实验表明,基于词素的神经机器翻译优于基于词的翻译,其最优模型的NIST值和BLEU值分别达到了9.4216和0.6320。
其他文献
虚拟仪器是计算机技术与仪器技术相结合的产物,代表了现代测试技术和仪器仪表技术的发展方向。计算机网络技术与虚拟仪器技术构成了网络化虚拟仪器,是测控技术领域研究的热点
肌理不仅存在于无穷无尽的自然物象之中,还存在于人们对美好事物的想象当中。肌理作为美术创作的一种内在驱动力,只有通过艺术家的努力实践和不断创新与应用,才能发挥出在美
在我国,旅游业的发展势头蓬勃向上,旅游业在GDP中所占的比重不断趋升,旅游收入对财政所作的贡献也越来越大。但近年以来,在国内旅游市场上刮起了一股强劲的“门票涨价”风,大
机械手是最普遍的一种机器人,是机械技术、电子技术、自动控制技术结合的产物。移动机械手同时具有移动和操作功能,是机器人学的一个重要分支,具有广阔的应用前景。移动机械
维护劳动者合法权益是我国工会的基本职责,这是修改后的工会法明确规定的。这一规定,一方面是顺应市场经济建立、体制改革深入的实际;另一方面体现了党和国家对弱势群体的基
口语是人与人交流最直接最有效的方式之一。随着我国大学英语教学改革的逐步深入,英语口语越来越引起语言研究者和大学英语教师的重视。但是相比较阅读与写作,口语仍然是大多
植被护坡是利用植被涵水固土的原理,在稳定岩土边坡的同时美化生态环境的一种新技术,其中坡面植物品种的选择和优化配置是植被护坡的重要环节,如何选好适宜的植物品种和科学
现代经济增长理论对经济增长的不同因素进行了阐释。金融作为经济增长的重要动力,不仅直接反映经济的区域性特征,而且经济增长的区域性一般要借助于金融的区域化运行才能实现
<正>不少家长认为矿泉水、纯净水比自来水干净安全,更适合给宝宝补水。其实,纯净水失去了普通自来水的矿物元素,而人体所需的微量元素很多必须从水中吸收,所以不宜长期用纯净
<正>全职太太何某曾经一度以为,这是她在丈夫离开后独自带孩子的艰辛中,找到的一条赚钱捷径。她在微信朋友圈里卖假名牌,半年销售额达11万多。昨天,杭州经济技术开发区人民法