维汉翻译中若干基本问题的研究

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:liuchun9876
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
统计机器翻译(Statistical Machine Translation,SMT)是自然语言处理(Natural Language Processing,NLP)领域最困难的问题之一。为了让使用不同语言的人能更好地交流,机器翻译显得尤为重要;它能够作为一种辅助性的翻译,提高人工翻译的速度和效率,从而节约人工翻译的成本。因此,统计机器翻译近来年成了自然语言处理领域的研究热点之一。  大多数统计机器翻译的研究,都集中在英语与汉语之间的翻译问题上。中国是一个多民族的国家,为了促进各民族之间的团结与交流,使得各少数民族语言到汉语的翻译被人们所关注。本文选择了比较有民族特色的维吾尔语(以下简称维语)到汉语的翻译作为研究内容。  本文首先详细分析了统计机器翻译的研究现状,指出了现有两种比较典型的翻译模型的特点;然后结合维语的语言特征,分析了目前维汉翻译中的一些基础工作的不足,接着对这些不足进行改进,从而提高维汉翻译的质量。本文在以往的基于规则的维语词法分析基础上,提出了一种基于有向图的概率统计模型进行维语的词法分析,该方法不仅在准确率和召回率上有所提高,同时也大大提高了维语词法分析的速度。然后,在此基础之上,提出了一种基于上下文的拉丁维语自动拼写校对方法,减少了拼写校对中的人工干预,并很好地利用了上下文信息。  本文最后在词格翻译(1attice-based translation)和系统融合的基础之上,将两者结合起来,使得源语言(维语)的信息得到更充分地利用。先把维语词法分析的结果构建成词格,然后翻译词格,将多种翻译结果利用系统融合技术结合到一块,得到最佳译文,从而进一步提高维汉翻译的质量。
其他文献
在实际的工程优化问题中,绝大多数都属于多目标问题。多目标优化问题中的多个目标之间存在着相互制约关系,对一个目标的优化往往以牺牲另一个目标的优化值作为代价。与单目标优
移动支付,一种在射频识别(RFID)和互连技术基础上发展起来的技术,也可称为手机支付,可定义为:“通过手机等移动通讯设备来进行交易的行为方式”。随着第三代移动通信的大规模推广
地图是空间信息的载体,在寻路过程中作为路线信息的展示工具,它扮演着重要的角色,然而,传统的地图加载了许多在寻路情形下不必要的信息,过多的细节阻碍了用户对信息的快速提取,同时
高光谱遥感技术是20世纪80年代以来对地观测领域出现的一种新型的遥感技术,是目前遥感技术发展的前沿之一。高光谱遥感具有较高的光谱分辨率和连续的光谱覆盖特性,使得在传统的
随着互联网信息开放式的发展,互联网中的信息指数式增长,信息过载的问题日益严重。如何在大量的信息中筛选出用户需要的信息成为当今互联网急需解决的问题。推荐系统就是诞生
面向服务的建模在构建面向服务系统的过程中,占据着核心地位。近年来,出现了很多面向服务的建模方法、面向服务的建模语言和相应的支持工具。众多的方法和语言使得面向服务的
随着嵌入式计算技术、无线通信技术、无线传感器网络技术和自动控制技术的飞速发展和日益成熟,物联网技术应运而生。该技术可以将人类生存的物理世界网络化、信息化、将分离
AdHoc网络是一组无线移动终端所组成的临时自治系统,具有多跳、分布式、自组织等技术特征。目前AdHoc网络物理层和MAC层的技术与WLAN相同,物理层采用的主要技术为IEEE802.11a
随着计算机网络规模扩大及互联技术发展,网络安全受到严重威胁。传统的网络脆弱性分析方法己不满足当今的网络安全需求,深入研究网络系统中已知或未知计算机攻击及其对应的脆弱
随着互联网的兴起,全国已进入全民网购时代,商品信息自动化比较搜索系统作为一种开放的、异构的网购代理服务是具有切实意义的。它提供了一个门户使用户能够快速检索到符合需