英汉机器翻译的语料库设计与实现

来源 :南开大学 | 被引量 : 0次 | 上传用户:zbtoy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
英语是世界公用语言。在中国国际化历程中,攻克英语语言理解难关是实现文化交流、经济交流乃至科技交流的必经之路。因而,在机器翻译研究领域,突破英汉机器翻译的技术瓶颈问题、提高英汉机器翻译水平具有重大政治意义和经济意义。 本文立足于自然语言理解规律的新理论——语言生成法,以基于语言生成法的英汉机器翻译研究为背景,提出了基于语言生成法的语料库模型——基础语料库。面向语言生成法的语言描述机制,对基础语料库的内容及结构体系进行良好的设计,建立完整的基础语料库和基础语料库的控制访问机制。 本文论述了基础语料库在基于语言生成法英汉机器翻译系统中的多方面应用,介绍了该系统中采用基于优先分析技术消除歧义的一些处理策略,讨论了对于词义多义性歧义消解的算法。
其他文献
水声传感器网络是无线传感器网络的一个典型应用,它能够实时地、大范围地监测目标海域的信息,在采集海洋数据、保证海域安全以及预测海洋污染等方面具有广阔的应用前景。但是
生物信息学将是21世纪自然科学的核心领域之一,其研究重点主要体现在基因组学(Genomics)和蛋白学(Proteomics)两方面。蛋白质是生命活动的物质基础,蛋白质分子结构可视化的目
随着集群技术的发展,集群越来越广泛的被运用于科学计算领域。从理论上分析,集群模型既能提供高可用性和高性能,也能提供可管理性、可扩展性。但目前,这仅仅是模型上的理论阶
经典规划对规划问题做如下三条假设:(1)规划问题的目标是世界状态的逻辑描述;(2)规划器所采取的动作是改变世界状态的唯一来源;(3)动作由前提条件与效果来描述。前提是动作能
随着企业的不断发展,企业积累了大量的数据。面对海量数据,企业决策者需要了解隐藏在这些数据背后的重要知识以辅助企业的决策制定。传统的决策支持系统存在数据缺乏组织性和
使用代理进行本地差错恢复和拥塞控制是一项用于克服可靠组播中一些著名问题的可扩展技术。它的主要思想是将组播树划分为多个子群,形成一个以组播源为根的层次结构,也就是术
Internet技术的广泛应用,使人们可以方便地进行信息交换和共享,但是也给计算机系统带来了前所未有的安全隐患,信息在传输的过程中可能被窥视或篡改,内部网可能遭受非法访问和攻击
随着网络技术的飞速发展,在分布式环境下协同开发软件项目已逐渐成为软件开发的发展趋势。分布式文档处理系统DWPS的开发目的,就是为项目管理人员和开发人员提供一个协同的项
近年来,分布式系统得到了飞速的发展,其规模越来越大,复杂性越来越强。分布式系统由多个安全域构成,每一个域内通过集中控制来保证其安全性。对于单域内访问控制主要研究集中
智能规划是人工智能的一个重要领域。近年来,有关智能规划的研究在问题描述和问题求解两方面得到了新的突破,使得智能规划已成为一个热门的人工智能研究领域。对智能规划算法