中文字粒度切分在蒙汉机器翻译的应用

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:hua1kai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器翻译任务中,主流的深度学习算法大多使用词或子词作为基础的语义单元,在词或子词层面学习嵌入表征。然而,词粒度层面存在一系列缺点。该文基于LSTM和Transformer蒙汉翻译模型,对蒙文进行子词粒度切分,对中文分别进行子词和字粒度切分对比实验。实验结果显示,相比于子词粒度切分,基于Transformer的蒙汉翻译模型和基于LSTM的蒙汉翻译模型的字粒度切分有极大的BLEU值提升,字级别的蒙汉翻译模型在验证集和测试集上都显著优于混合字和词的子词级别的蒙汉翻译模型。其表明,字级别的蒙汉翻译模型更能捕捉单
其他文献
无功补偿方案的确定,影响因素众多,缺乏科学量化的方案评价。文章提出基于多层次灰色关联分析法的无功补偿方案评价模型,利用层次分析法确定指标权重,该权重经过熵值法调整降
目的:探讨情景模拟培训对急诊抢救室不同年资护士的应用效果。 方法:选择2017年至2018年在我院急诊科工作的在职护士56名,按照年资不同平均分成两组进行培训,其中一组为对照
一、教学设计1.教学目标知识与能力:了解作文拟题应注意的问题,尝试运用五种方法自拟题目.过程与方法:鼓励学生自由地、有创意地表达内心所想.
期刊
期刊
一、以生为本,遵循原则教学教研,不论如何改革,怎样大胆尝试,都必须从学生的实际情况出发,着眼于学生的长远发展,遵守教学原则,否则必然会偏颇。现在,美术教学的原则大致有直