基于音节切分的维吾尔人名汉字音译研究与实现

被引量 : 0次 | 上传用户:whlibb2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
维吾尔人名汉字音译是少数民族语言信息处理中需要解决的重要问题,并且在机器翻译、信息检索等应用中很重要的作用。近年来,因为新疆少数民族人名汉字音译转写缺少统一标准,维吾尔人名汉字音译转写时,在户口上是一种写法,在身份证上另一种写法,在护照上更不一样的用字写法、汇款单等又是一种写法。为此解决这些问题,本文主要对基于字形的DOM音译框架及维吾尔语音节分解的相关问题进行了较全面的分析,并在此基础上针对维吾尔人名汉字音译问题进行研究,论文的主要内容包括以下几个方面:1.本文首先介绍了基于字形的DOM音译框架,探讨了维吾尔人名汉字音译在该音译框架的可行性。可知,该音译框架将源语言中的字直接匹配到目标语言中的字的特点,并且维吾尔人名汉字音译,其实是维吾尔文字母或音节直接匹配到对应汉字的过程,因而充分利用该音译框架实现了维吾尔文字母及音节到汉字的映射。2.本文在研究维吾尔语音节切分相关的理论和关键技术的基础上,总结了维吾尔语音节分解原理,并实现维吾尔语音节分解统计系统,对5000人名进行音节分解的统计,给出了维吾尔人名中常用音节分布情况,并提出了20个常用的构成维吾尔人名的音节。3.在基于字形的框架下,设计出音节分切的维吾尔人名汉字音译的基本思想和总体框架,并在分析维吾尔人名汉字对音表结构的基础上,提出了维吾尔人名的字母或音节对汉字映射的最快、最有效的方法,基于矩阵的维吾尔人名对汉字映射的方法。实现了基于音节切分的维吾尔人名汉字音译系统,并对系统进行测试,使用5000个随机人名进行音译实验,得到了仅52%的准确率。4.本文为提高音译准确率,通过对大量维吾尔人名进行调研,找出106构成维吾尔人名词缀,并构建基于人名词缀的补充规则,因而能够区分维吾尔人名性别。将规则用在维吾尔人名汉字音译系统,进行二次测试,音译准确率提高了30%,最终达到了86%音译准确率,从而显示了本文提出的方法和规则的可行性,有效性。
其他文献
古筝作为我国古老的民族乐器在中华大地上已传承了几千年。中国筝文化的自然意境已经是中国音乐特有的音乐现象,寄托着对自然的尊重,抒发着社会人的内心希冀。本文主要从以“自
被誉为“钢琴诗人”的波兰作曲家、钢琴家弗里德里克·弗朗索瓦·肖邦一生中创作了大量的钢琴作品,他创造了典型的浪漫主义钢琴音乐语言,对浪漫派新音响色彩的探索开辟了新的音
<正>美味的菜肴离不开各种调料,众所周知,盐最好要晚放,然而糖、醋、料酒等调料应该什么时候放入,才能做到美味与营养兼得呢?食糖在烹调中添加食糖,可提高菜肴甜味,抑制酸味,
期刊
GMSK(高斯最小移频键控)信号优良的频谱特性在跳频通信中有广阔的应用前景。本文分析了GMSK调制器的设计理论,给出了一种全数字实现结构并在FPGA上加以实现。仿真结果表明,这
借助结构方程模型对物流行业企业文化与员工工作倦怠关系进行研究。通过对物流行业的400余名员工的调查发现,物流行业的企业文化是员工工作倦怠产生的一个重要原因。指出物流
目的:初步探讨血清炎性因子白细胞介素-17(IL-17)、白细胞介素-18(IL-18)、白细胞介素-33(IL-33)在阻塞性睡眠呼吸暂停低通气综合征(OSAHS)及合并高血压患者体内的相关水平的变化及临
<正> 忌用牛奶服药有一些病人在吞药片或胶囊时,不用开水,而是用牛奶,这是不对的。因为牛奶中含有比较丰富的钙、铁等离子,这些离子同某些药物发生化学反应后,结果生成稳定的
基于数据采集和存储技术的数据挖掘技术,已经在工程实践中得到了广泛应用。为了充分利用军事训练管理数据库的资料,评估各类军官的考核成绩,作者在查阅了近25年军事训练成绩
在高中英语教学中,英语阅读教学占有重要地位,它对于培养学生的阅读能力,特别是语言的综合运用能力起着至关重要的作用。然而,在传统教学中,教师忽略了学生在课堂上的主体性
在我国全面构建社会主义和谐社会的进程中,中小企业越来越成为推动社会进步和经济发展的重要力量。随着市场经济的不断完善,市场竞争也越来越大,中小企业也处于这一高速增长