融合先验信息的蒙汉神经网络机器翻译模型

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:qncypt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络机器翻译模型在蒙古文到汉文的翻译任务上取得了很好的效果。神经网络翻译模型仅利用双语语料获得词向量,而有限的双语语料规模却限制了词向量的表示。该文将先验信息融合到神经网络机器翻译中,首先将大规模单语语料训练得到的词向量作为翻译模型的初始词向量,同时在词向量中加入词性特征,从而缓解单词的语法歧义问题。其次,为了降低翻译模型解码器的计算复杂度以及模型的训练时间,通常会限制目标词典大小,这导致大量未登录词的出现。该文利用加入词性特征的词向量计算单词之间的相似度,将未登录词用目标词典中与之最相近的单词替换,以缓解未登录词问题。最终实验显示在蒙古文到汉文的翻译任务上将译文的BLEU值提高了2.68个BLEU点。
其他文献
动态规划检测前跟踪(DP—TBD)算法是一种检测微弱目标的检测方法,可明显改善信噪比,但检测目标的提取与识别仍是技术难点。利用轨迹特征剔除虚假目标,提出一种目标综合识别方案。
《廊桥遗梦》是罗泊特·詹姆斯·沃勒于1992年推出的一部长篇小说。细读文本,发现其具有深厚的文化内涵,该文主要从牛仔文化、厨房文化、两性文化三方面进行了分析。
新的环境保护法规定,把公路建设的环境问题列入议事日程,要求同设计,同投入,同施工,结合施工实际,介绍了在施工过程中的环境污染及其防护措施。
车床是机械加工中的重要设备之一,它普及面广且用途广泛。但在车削实践过程中,人们也逐步发现它的缺点:低效率、高耗能和较低的安全保障等问题,作者通过不断实践和改进,带领研发团
运用特征矢量法,对三轮伸缩臂叉装车在静止状态下进行研究,求得静态稳定性应满足的条件。使用Matlab软件,建立伸缩臂叉装车数学模型,分析伸缩臂叉装车静止状态下稳定性能,为
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
企业业绩评价是企业管理的基本前提,业绩评价与激励机制相配合。才能有效实现企业发展战略目标,企业经营环境变化呼唤科学合理的业绩评价制度。树立以人为本的理念,将EVA和平衡
通过分析河北省环京津带乡村旅游面临的新形势,对其发展中存在的经营模式、市场开发、资金投入、资源整合等方面的瓶颈问题进行了深入探讨,并从体制、规划、营销等多个层面提出
配电网结构复杂,故障电流弱,且存在间隙性电弧,分支多,故障选线困难。为解决传统的选线方法准确率低,无法准确采集到行波信号而导致故障选线失败等问题,提出了基于行波信号的配电网
上世纪末,"东欧剧变"导致很多社会主义国家制度一夜崩塌,大多倒向资本主义阵营。面对这样的变化,西方学者针对社会主义发展形成了不同的观点,这些理论被他们称为"后社会主义