基于实例的蒙汉机器翻译的研究

来源 :内蒙古工业大学 | 被引量 : 5次 | 上传用户:jettey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译(Machine Translation,MT)是指用计算机自动地将一种源自然语言,翻译成用户需要的目标自然语言,在本课题中即是将蒙古语翻译成为汉语。机器翻译作为自然语言信息处理的一个分支,经过了长期而迂回的发展历程,经历了从辉煌到绝境到复苏到发展的风云变幻。近年来,随着计算机硬件的提高,基于实例的机器翻译方法(Example-Based Machine Translation,EBMT)越来越受到研究者的关注。基于实例的机器翻译方法攻克了传统意义上的基于规则的机器翻译方法在知识库获取时遇到的难题,避免了复杂的深层次的语法语义分析,充分利用原有实例库的信息,利用相似度算法进行匹配和重组,得到最终的译文,具有译文准确、翻译速度较快等优点。本课题讨论了机器翻译的研究的目的和意义,简单的介绍了机器翻译的国内外研究现状,并就蒙古文的信息处理和蒙汉机器翻译研究现状进行了简要的阐述;然后课题讨论了机器翻译的发展历史以及各种方法,之后重点介绍了基于实例的机器翻译的基本原理和系统结构。以此为基础,论文阐述了蒙汉双语实例库的构建方法,给出了蒙汉双语语料库处理中使用的不同粒度的(段落级、句子级、词语级)的对齐技术,形成了一种多层次对齐方法,提高了双语语料对齐的正确率。接着,论文讨论并给出了基于词语的句子相似度算法以及最相似实例检索算法。最后,论文就对基于实例的蒙汉机器翻译方法进行了实验,并对翻译结果性能进行了评测,并就结果进行分析,给出了该方法的优点以及存在的不足。实验结果表明,结果达到了预期目标,即可以简单的蒙文文本的翻译,并且在实例库中有与待翻译语句相似例句时,能够得到较高质量的译文。
其他文献
未来空间站系统规模庞大,而作为整个航天器神经中枢的控制系统,其信息体系结构更是空前复杂。对于多航天器构成的空间站而言,每个航天器单独飞行时采用一套完整的控制系统,当
随着计算机应用的不断发展,实时系统的应用越来越广泛,并行计算也成为主流,同时,并行任务分配与调度算法成为并行计算系统的核心,直接影响到系统的整体性能,至今国内外专家已
无线传感器网络已经在生活各领域得到了广泛的应用,尤其在军事、医疗和公共安全等重要领域。但以数据为中心的传感器网络受到传感器节点固有资源的限制,网络中传输的数据面临着
命名数据网络(NDN)是一种以内容为中心的新型网络架构,主要根据数据名字对数据进行路由和转发,解决了用户对网络中海量、异质信息高效访问的需求,同时规避了TCP/IP网络在安全性
近年来,不确定性作业车间调度问题引起了研究者的广泛关注。不确定因素的引入大大增加了对生产调度问题的分析和建模的难度。但是,同时对不确定条件下的作业车间调度问题的研
随着互联网技术和浏览器技术的快速发展,越来越多的桌面应用成功地转向了浏览器平台,但浏览器基于HTTP协议的特性,使得客户端和服务器端难以维持持久连接的状态。服务器推送
灾难现场危险的工作环境给人员搜救带来了极大的困难。随着计算机技术的发展,机器人技术得到了广泛的应用,如何将机器人应用于灾难现场的人员搜救工作是一个有重要研究意义的
无线传感器网络(Wireless Sensor Network, WSN)中的关键问题就是传感器节点能量的有限性,节能高效地使用节点能量是WSN面临的一大挑战。本文研究WSN中传感器节点能量高效控
车牌识别是智能交通系统中最关键的研究课题,有着广泛的应用前景,如交通道路监控、高速公路自动收费、停车场管理等。随着经济社会发展,机动车辆日益增加,对车辆进行安全管理
以往的生产调度一般是将产品按工件分解,加工和装配分别处理,但这些生产作业调度的算法主要适用于大批量相同产品的生产。当生产产品属于多品种小批量,特别是具有树状结构的单件产品时,将加工与装配分别处理,必然影响产品加工与装配内在的可并行处理关系,影响调度效果。因此本文研究的复杂产品加工和装配综合调度优化具有重要的理论和实际意义。表面上产品工艺树中最长路径上工序的加工时间和是产品完工时间的下界,事实上由于