统计机器翻译中汉维短语对抽取的研究

来源 :新疆大学学报(自然科学版) | 被引量 : 0次 | 上传用户:xiaobudian1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双语短语对抽取是基于短语的统计机器翻译中短语翻译模型训练的关键步骤,但由于汉维平行语料库规模有限,数据稀疏问题严重.本文提出了一种改进的短语抽取算法,该算法首先考虑词对齐矩阵中一个汉语词对齐到多个维吾尔语词的情况(包括不连续),然后利用Och方法抽取短语对,最后考虑维吾尔语SOV语序结构特点,抽取双语短语.实验表明,该算法能够较准确地且尽可能多地抽取汉维短语对,从而提高翻译模型的质量.
其他文献
概念思维以抽象和同一为手段,会使文学翻译沦为僵化的概念重复,并因而使其丧失应有的生命灵韵。移情作为对概念化思维的超越,是要把“他者”视为另一个同样独特的生命个体,在
经过近十年的高职英语分级教学改革,英语分级教学已经逐渐趋于成熟。随着信息技术的发展和网络资源的不断完善,在课堂分级教学的基础上,高职英语如何充分利用网络环境促进分
在全球化需要大量翻译的时代,我国非英语专业的翻译教学却处于边缘化地带.本文强调非英语专业翻译教学的重要性,结合大学英语教学的现状,提出了一些建议.
We investigate the light scalar mesons and glueballs in the D_p-D_q hard-wall models,including D_3-D_q,D_4-D_q,and D_6-D_q systems.It is found that only in the
庄子一文中的"朝菌",历代不少注家为之诠释,各有其说,莫衷一是.我们认为,根据原文的前后关系、句法结构以及句子意义诸方面的因素来看,释之为"虫名"更为妥帖.
文章概要写作是对原文的高度浓缩,在专业英语精读教学中,经常指导学生对文章进行概要写作训练,不仅可以帮助学生掌握文章的中心,提高阅读理解能力和阅读效果,而且能锻炼学生
文章主要分为三个部分,第一部分说明零起点混合班的形成;第二部分简单阐述零起点混合班综合课的现状及面临的问题;第三部分,是文章的重点,根据当前的现状及问题,对零起点混合
语言文学及相关理论对于外语语言学习而言是必不可少的材料.文学发展的时期复杂性不可避免的导致文学种类的繁多.文论理论因而发展而来,并对语言文学进行了系统的和科学的归
目的:探讨癫(癎)患者血清S100β蛋白浓度与学习记忆的关系.方法:①用酶联免疫吸附法检测63例原发性癫(癎)患者及40例对照组血清的S100β蛋白浓度;②以对照组血清S100β蛋白浓
本文探讨了英语学习者的各类身份与英语学习的关系问题,以学习者身份的多样性与可变性为着眼点,论述了语言在学习者的身份形成过程中起着至关重要的作用。而学习者的身份又会