泛化的基于实例方法的汉语维吾尔语模板库的构建

被引量 : 0次 | 上传用户:xp1987627
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译(Machine Translation)是指用计算机自动地将一种人类语言转换成另一种人类语言。作为解决人类交往障碍的有效手段,机器翻译研究受到了越来越多的重视。在不同策略的翻译方法中,基于实例的机器翻译方法具有译文精确,翻译速度快,获取翻译知识简单的优点。但是在实际应用中,巨大规模的实例库反而会降低系统的运行效率。因此提出泛化的基于实例的方法,对双语语料库提取翻译模板,在空间维度上将实例库抽象化为模板库,并且根据获得翻译模板进行翻译,在保证翻译质量的同时提高了匹配率。本文正是研究了如何抽取汉语维吾尔语模板,建立对齐模板库,并在其基础上进行模板匹配的方法。本文首先介绍了机器翻译的发展史和研究背景,从两个角度分别介绍了机器翻译的典型策略和方法。然后介绍了维吾尔语信息化建设及机器翻译研究的现状,分析介绍了本文工作开展的基础和必要性。在详细分析和阐述了泛化的基于实例的方法之后,提出了自动抽取汉语-维吾尔语对齐模板的方法,并且实现了利用已抽取的模板对输入句子翻译并输出译文。具体来讲,本文在以下方面做了一些探索性工作:设计实现了模板提取语料的筛选机制,并分析定义了该语料库的共同点,采用词性作为模板槽的约束条件;设计并实现了维吾尔语汉语句子词对齐工具,将语料库中的句子处理为词对齐形式,根据此结果来进行模板的提取、匹配和翻译;给出了模板的定义,并且根据词性和词对齐情况实现了汉语维吾尔语模板抽取算法,成功建立了小规模的模板库;根据模板库的存储组织,设计实现了模板匹配算法,成功输出了译文;融合前面的系统,实现了基于模板库翻译的原型系统,验证了泛化的基于实例方法在汉维机器翻译领域的可行性。
其他文献
建设项目全过程投资控制是针对整个建设项目目标系统所实施的控制活动的一个重要组成部分。投资控制工作是一项贯穿于项目实施各个阶段,由项目参与各方协同完成,涉及技术、经
针对常用导航雷达在检测强海杂波环境下慢速小目标的困难问题,利用扫描间海杂波非相关特性,提出采取提高天线转速的措施和扫描间信号平滑处理技术,从而抑制或削弱海杂波,增强
本研究从新疆传统药用植物骆驼刺(Alhagi pseudalhagi Desv)内生菌中筛选出一株对玉米大斑病菌(Exserohilum turcicum)和玉米小斑病菌(Bipolaris maydis)具有较强抑制活性的
中医药治疗高血压病有丰富的临证经验,并在逆转靶器官损害、药物毒副作用较少、改善患者生活质量等方面有独到优势。目前,中医药治疗高血压病的文献资料众多,本文拟从治病八
制备了一种自交联核壳型丙烯酸弹性乳液,测定了其红外光谱及粒径分布,并研究了该乳液在涂料配方中不同乳液用量对涂料拉伸性能及耐沾污的影响。采用扫描电镜表征了不同乳液含
小学阶段是语言学习的最佳时期,低年级学生在英语学习方面更加侧重于基础的短语、对话和单词的背诵,而进入到高年级以后,则更多的开始学习一些简单的语法知识。本文分析了在
冠状动脉慢性完全闭塞病变是最富有挑战性及最容易失败的一类冠脉病变,如何评估此类病变介入治疗的难度及预测成功率至关重要,本文就影响CTO介入治疗成功率的重要因素及最新
目的:食管胃静脉曲张破裂出血(esophageal and gastric varicesbleeding, EGVB)是肝硬化门脉高压症患者最常见、最严重的并发症之一,也是患者死亡的主要原因。因此必须采取快速
在平顶山姚孟发电有限公司4号机组烟气脱硫装置上进行了不同负荷、不同循环泵运行数量下吸收剂浆液pH值变化对脱硫效率影响的试验研究。试验发现,吸收剂浆液pH值对脱硫效率影
本文介绍了ASN .1和BER基本编码规则 ,分析了 7号信令协议栈的TCAP层消息结构和ASN .1之间的关系 ,详细介绍了应用于信令中继系统中的ASN .1编解码模块的设计和实现。