英汉机器翻译系统关键技术研究

来源 :解放军信息工程大学 | 被引量 : 11次 | 上传用户：gaolch012

【摘要】

：

机器翻译是自然语言处理的一个重要研究领域，在当今信息社会及军事部门有着广泛的应用前景。本文以英汉机器翻译系统为目标，对翻译机制、源语言分析、实例模式匹配、结构转换与

【作者】

：

郭永辉

【出处】

：

解放军信息工程大学

【发表日期】

：

2006年01期

【关键词】

：

机器翻译词法分析词性标注数据融合基本名词短语识别粗糙集浅层句法分析实例模式方法结构转换目标生成

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

机器翻译是自然语言处理的一个重要研究领域，在当今信息社会及军事部门有着广泛的应用前景。本文以英汉机器翻译系统为目标，对翻译机制、源语言分析、实例模式匹配、结构转换与目标生成等几个方面的关键技术和方法进行了研究，提出了一些解决问题的新观点和新方法，建立了具有较高翻译正确率的英汉机器翻译系统。本文主要完成了以下工作： 1、提出了基于转换与基于实例模式相结合的机器翻译方法。在翻译机制方面，研究了现有的各种机器翻译方法，比较各自的优缺点并结合现有资源和工作实际，提出了基于转换与基于实例模式相结合(TB-EPB)的机器翻译方法。该方法继承了基于转换方法的稳定性和基于实例方法译文质量高的特点。基于实例模式方法是基于实例方法的扩展，在词法和浅层句法分析后，输入句子与实例模式库在多个层次上匹配，并产生译文。评测和实验结果显示，译文质量综合评价值达到87.5，平均翻译速度为63.64单词／秒，译文正确率达到88％。 2、设计了一个基于规则的词法分析器。结合系统模型，研究并设计了一个基于规则的词法分析器，以及贯穿整个机器翻译过程的语言学知识源——综合词典。设计了词条检索的哈希算法，用形式语言描述了与该词法分析器相关的各种规则知识和数据结构。介绍了词法分析中形态预处理、形态分析、未收录词处理、词组分析和词性标注等各子模块的分析算法。 3、提出了一种新的词性标注融合策略——相关投票法。词性标注是机器翻译系统中的一项基础工作。本文对四种基于语料库的词性标注方法进行了深入研究，并在此基础上提出了一种新的词性标注融合策略——相关投票法，从理论上分析了该方法的优越性，并与其它融合策略进行了对比实验。实验结果表明，应用融合策略可以更加全面地描述词性标注知识，从而更好地完成词性标注任务：在几种融合策略中，相关投票法是最优秀的，它使标注的平均错误率降低27.85％。 4、提出了基于粗糙集的基本名词短语识别方法。基本名词短语(BaseNP)识别是自然语言浅层分析的主要研究内容之一。本文提出的基于粗糙集的基本名词短语识别方法用粗糙集理论解决BaseNP标注问题，并在此基础上用一个有限状态转换器实现BaseNP识别。论文介绍了基于粗糙集的规则学习方法和相应的算法，以及BaseNP标注和识别的算法流程；给出了详细的实验步骤和结果；通过实例冲突问题的解决，提高了识别效果；并与几种典型方法进行了比较与分析。结果表明，基于粗糙集的方法能够发现特征问的依赖性，并从整体上优化规则，BaseNP识别的Fβ值达到92.32％。 5、提出了基于扩展的CFG和GLR算法的浅层句法分析器。浅层句法分析是指短语级的自然语言句法分析，是基于转换和基于实例模式两种翻译方法共同的基础。本文提出的

其他文献

基于改进控制策略与动态无功支撑相结合的高电压穿越方法研究

针对双馈风力发电机高电压穿越问题,利用Laplace变换对电网电压骤升时电磁暂态过渡过程进行分析,得出定子电流不仅含有直流分量,还包含有工频交流成分,并通过仿真频谱验证了

期刊

高电压穿越暂态分析功率外环换流器无功电流支撑high voltage ride through transient analysis power o

论跳香的美学内涵

跳香节最初是湖南沅陵＂哇乡人＂祭祀祖先盘古的一种原始仪式,后来演化成乡民庆贺当年五谷丰收,祈祷来年风调雨顺等盛大的民俗活动。跳香是一种集戏剧、音乐、舞蹈、宗教于一体的

期刊

“哇乡人”跳香审美价值审美认知

河南安阳地区男性村民外生殖器HPV感染状况分析

目的:高危型HPV是宫颈癌发生发展的必要条件;HPV与其他恶性肿瘤的病因学关联正在逐步探讨和论证。相对宫颈HPV感染研究,男性外生殖器HPV感染研究匮乏。本文依托课题组安阳食

学位

现况调查男性外生殖器HPV感染食管癌队列研究

中国北方几种灌丛群落表土花粉与植被关系研究

中国北方20个典型灌丛群落主要花粉类型的百分比与植被盖度关系表明：除蒿及沙棘外，其它灌丛群落中，优势植物种的花粉百分比多低于20％。灌木花粉对植被的指示性研究表明：皂荚花粉为

期刊

中国北方灌木花粉百分比植被盖度花粉指示性

中西文化碰撞之书籍装帧

随着经济全球化，科技现代化时代的来临，中西方文化相互了解、交流更加频繁和容易，当代设计也进入了全球化形态。我国的书籍装帧设计也面临着与世界设计交汇的问题，本文从西方文化

期刊

书籍设计民族传统图形封面图形选择书脊造型元素

浅谈新课改革背景下班主任管理工作中的问题及对策

<正>一、课题的提出(一)研究背景素质教育就是以全面提高全体学生的基本素质为根本目的,促进学生个性健康发展。素质教育的根本任务就是教会学生学习,学会做人,学会生活。班

会议

电力机车PMSM自适应模糊滑模控制

为研究牵引工况下电力机车永磁同步电机(PMSM)的转速控制精度,考虑轮轨接触不平顺及车体静载荷在轮对径向产生的未知时变负载转矩,建立了机车PMSM在d-q坐标系下的数学模型。

期刊

电力机车永磁同步电机非线性转矩观测器自适应模糊逻辑系统Nussbaum函数自适应模糊滑模控制

中国共产党在大革命中的领导作用研究

大革命是指1924年至1927年在中国大地上发生的反帝反封建的革命运动。它是由国共合作的建立、国民党的改组；广东革命根据地的统一；工人、农民、青年、妇女运动的蓬勃发展与北伐

学位

大革命中国共产党党的领导作用政治领导

上海国民党基层组织研究

中国古无政党,国家大事取决于以帝王为首的贵族、官僚体系,可以称之为“帝治”。中国近代政党的雏形,始于1894年孙中山在檀香山创立的兴中会。1905年,孙中山在日本东京成立中

学位

中国国民党基层组织上海1924-1927年

小学生生活形态及其与人格的关系——对北京、上海、广州、天津、南京和重庆六城市的调查

<正>生活形态是现实生活中不同群体共同的生活样式或类型,人格作为核心的个体变量,对生活形态的形成和发展有重要作用。研究采用小学生生活形态问卷和“小五”人格问卷(邹泓

会议

生活形态人格小学生

英汉机器翻译系统关键技术研究

与本文相关的学术论文