【摘 要】
:
维吾尔语是典型的粘着性语言,其复杂的形态以及众多的词缀影响维吾尔语-汉语词语对齐的质量.本文提出对维吾尔语词进行形态分析并词干与词缀分离,再进行对齐;并根据维吾尔语
【机 构】
:
新疆大学信息科学与工程学院,新疆多语种信息技术重点实验室,中国科学院 计算技术研究所 智能信息处理重点实验室
论文部分内容阅读
维吾尔语是典型的粘着性语言,其复杂的形态以及众多的词缀影响维吾尔语-汉语词语对齐的质量.本文提出对维吾尔语词进行形态分析并词干与词缀分离,再进行对齐;并根据维吾尔语遵循语音和谐规律的特点,对维吾尔语词缀的变体采用统一的表示方法,使得词缀呈现相同的形式.通过以上方法欲达到抑制维汉词语对齐中数据稀疏现象.本文利用此方法处理了新疆多语种信息技术重点实验室提供的维汉双语语料,再利用GIZA + +进行对齐,试验结果表明,此方法对词语对齐效果起到了明显的积极作用,而且对维汉机器翻译的质量也有显著的提高.
其他文献
目前我国出版业已进入一个新的阶段,我国正由一个出版大国向着出版强国的目标迈进.但我国出版业在未来的发展走向中同样面临着巨大的机遇和挑战,主要表现在我国出版集团化发
原子间存在着多种形式的对称现象,与经典物理学中的部分现象相似。文章借助经典物理学中对称现象,通过上升域语言,扩展操作语言,将保持变换不变性的操作都归纳在对称操作之中
以现象学方式重建改进了的摩尔式“开放问题论证”,可以确立一种分析现象学的方法论基础.遗传观念的形成是一个不断进行“替换悬置”的现象学还原过程.第一类因果延伸法为形
目的 探讨儿科病房在微量注射泵应用中存在的医疗风险,应采取的管控措施.方法 针对微量泵注射中的医疗风险,制订针对性的管理制度,比较执行制度前后的护理效果.结果 儿科病房
依据热力学第一、第二定律(下文简称一、二定律)阐述了能具有量和质的双重属性,能量与能质系于同一属体而不可分离.(火用)是由热力学第二定律所赋予的用以表征能质的参数.能
清光绪本《六音字典》里有着丰富的“土音”材料,反映了20世纪末福建闽北方言方言的底层。全文可分五部分:一、土音与文读音字音节“某同而某、某不同者”;二、土音与文读音
通过对严复所译《法意》首段与1752年纳琴特英文版首段以及与张雁深所译《论法的精神》首段之比较研究,我们发现,严复的翻译可圈可点,这是其一。其二,严复据英文版所进行的翻
Neurilemmomas is usually a benign neoplasm which is composed of Schwann ceils, also named schwannomas and originates from the peripheral nerve sheath. It most f
设计并实现了一个哈萨克文语料库管理系统.哈萨克文语料库管理系统能很好地对哈萨克文语料进行科学有效地管理,可以为以后哈萨克语言学研究提供可靠的素材.
A physically based empirical model was established for the beginning and ending dates (BED) of limited temperatures.Data used were daily mean temperatures from