基于实例的机器翻译方法(EBMT)的分析和研究

被引量 : 0次 | 上传用户:squallcl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译作为计算机自然语言处理的一个重要分支,其研究具有重大的社会经济价值。基于实例的机器翻译(EBMT)作为一种经验主义的方法,避免了复杂的深层次语法和语义分析,为机器翻译的发展指出了一条新路。本文首先回顾了机器翻译的发展历史,并详细描述了机器翻译研究的现状。介绍了当今机器翻译领域的主要理论和方法,尤其是九十年代以来产生的新的基于语料库的方法,比较了新的经验主义的方法和传统的理性主义的方法的优缺点,讨论了机器翻译研究的发展趋势及其应用前景。本文着重对基于双语对齐树库的EBMT方法进行了介绍。双语对齐树的引入使得EBMT系统的适应性和准确性得以提高。树对齐兼顾了单词对齐和结构对齐的特点,树的结构可以有效地表示语句中包含的结构信息和语法信息。本文对几种重要的基于双语对齐树的EBMT模型作了介绍。接着本文介绍了EBMT系统的标注集和标注规则,以及对齐的方法和对齐关系的表示。系统使用基于可扩展标记语言(XML)的文档作为双语对齐树库的存储结构和表示方法。另外本文还给出了EBMT系统的翻译算法。本文实现了一个基于双语对齐树库的EBMT系统,该系统使用VC进行开发,并通过微软提供的MSXML解析器对作为例句库的XML文档进行操作。本文还介绍了在EBMT系统实现过程中遇到的一些问题及解决的办法,或是提出了可能的解决问题的方案。最后,本文给出了对该EBMT系统翻译性能进行测试的结果,分析了该系统的优缺点以及系统中存在的不足,总结了实现过程中的经验,并对EBMT系统未来的发展前景作了分析和展望。
其他文献
情报主导警务(Intellgence-led Policing)是21世纪初在全世界范围内掀起的警务变革,其所体现的警务运行管理和社会治安治理理念和方法也对中国警务运行模式变革不断产生着影响。目前,我国已是新的信息化技术发展的高地,5G网络技术、大数据技术、人工智能等一系列的新的信息化技术的快速发展为情报主导警务在我国本土化实施提供了比较优势的技术环境。情报主导警务先进理念和先进网络数据技术及相关
谐波电流损害电器设备、缩短设备的使用寿命、降低电能使用和传输效率,形成资源浪费和环境污染,存在着巨大的安全隐患。阐述谐波检测和抑制的意义,探讨谐波检测和抑制的方法
胶凝砂砾石(CSG)坝是在碾压混凝土坝和面板堆石坝的基础上发展起来的。文章通过国内外CSG材料筑坝实践和研究现状,归纳分析了CSG坝的特点及大力开展CGS材料、本构模型、工程
特征选择一直是模式识别领域的研究热点之一。模式识别是对数据进行分类,分类的过程可以在原始数据空间中完成,也可以对原始数据进行变换,将数据映射到更能反映分类本质的特征空间中进行。在特征空间中得到的分类模型无论是模型的训练时间还是模型的可解释性都优于直接从原始数据得到的分类模型。所以特征选择的研究是模式识别的一项重要任务。论文详细介绍了基于互信息的过滤式特征选择算法的基本概念,在分析了已有的特征选择算
作为语言学的重要分支,语用学近几年在语言习得研究中也占有一席之地。本文从语用学角度讨论了语用学理论与语言教学的关系,对语言应用进行了理论分析,在此基础上,从语用学角
目的:观察电针手厥阴心包经“大陵”,“内关”,“郄门”穴对急性心肌缺血家兔心肌细胞血管内皮生长因子(VEGF)表达的影响。探讨针刺改善急性心肌缺血及心包经穴与心脏相关联
目的 研究蒙药章古-3汤对腺嘌呤诱导大鼠CRF的干预作用及其机制。方法60只Wister大鼠随机分为6组:空白对照组、病理模型组、章古-3汤高剂量治疗组(20g·kg-1·d-1)、章古-3汤
随着信息技术的快速发展,文本数据量不断增长,如何高效、准确地定位有效信息成为当今时代下的迫切需求。文本分类作为信息处理的核心技术成为解决这类问题的关键手段。在文本分类过程中,高维数据容易引起分类过程中的维度灾难,特征选择是解决维度灾难,实现维数约减的有效方法,因此论文以文本分类过程中的特征选择方法作为主要研究内容。论文首先简要概述了文本分类技术,并介绍了其详细过程,在每个步骤中都列举了一些常用的方
目的: 1.消岩汤剂抑制LA795肺腺癌转移的药效学研究。 2.消岩汤剂对LA795小鼠肺腺癌肿瘤新生血管形成及nm23-H1表达的影响,探讨消岩汤剂抑制肿瘤转移的部分机理。 方法:
马铃薯淀粉废水由清洗废水、淀粉提取废水、淀粉清洗废水3种工艺废水组成。根据3种工艺废水的水质特点,提出清洗废水应进行沉淀循环利用,淀粉提取废水宜先回收利用后再处理,