基于实例的英汉机器翻译系统

来源 :东北大学 | 被引量 : 0次 | 上传用户:chhy6266746
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出将一个基于实例的机器翻译系统的具体实现分为五个步骤的观点,即:资源的获取、资源的管理、实例的获取、实例句对的词对齐、句子的合成. 基于实例的机器翻译的基础是存在大量的翻译文本(即,平行的双语文本),因而我们将《英语900句》、《实用体育英语》、《实战体育英语》这三本书作为语料库的数据来源,经过自动抽取和人工校对的方法,得到一个有关体育领域的双语词表和一个子句层对齐的双语句对列表.在实例的获取阶段,该系统使用了动态规划(Dynamic Programming,DP)匹配算法来计算同一种语言中两个词语片段之间的相似度.Emmanuel PLANAS等提出的多层次相似片段匹配算法(Multi-level Similar Segment Matching,MSSM)是一个比较两个具有相同分量的词语片段的精确的、快速的方法,并提供一个无歧义的词对词的匹配结果.这个算法在实例库中检索最好的实例非常有效.使用戴斯系数(Dice Coefficient)方法,利用汉语单词之间的戴斯系数,计算出一个英文单词和中文单词之间的相似度,然后取相似度最大的那个作为对译词,从而实现了最相似的实例句对在子句层的单词对齐.也就为下一阶段的句子合成找出了需要进行删除和替换的单词或短语.
其他文献
该文通过在对多种常用的文本特征项的权重计算方法的分析后,归纳分析得出决定权重的若干因子,并据此假设出一种方法,并应用了文本分类的技术.对此权重计算方法中涉及到的各个
近十几年来,分布式系统环境得到了广泛的关注和研究。分布式计算将需要庞大计算资源的问题分割成若干子问题,这些子问题再由系统中的多个计算机分别进行处理,各个计算机处理
本文分析了基于网络的IP VPN的四种主要实现模型对QoS的支持,同时比较了VPN环境中提供QoS支持的两种服务模型——Pipe模型和Hose模型,探讨了Hose模型的不同实现方式对服务提供
面各对象程序切片中类层次图的研究是该论文研究的课题,它是面向对象程序分析的一部分.该论文在研究现有的基于过程的程序切片和面向对象的程序切片的基础上,结合面向对象程
该文采用物理方法对柔性物体的模拟进行研究.柔性物体模拟的速度和效果在仿真中具有很重要的意义,同时也是一个难点问题.该文采用自适应多层处理的方法将模拟过程分为几个阶
IP组播是一个新兴的领域,它能带来的最大好处就是在组播网络中即使用户数成倍增长,主干带宽也无需随之增加。因此组播成为当前网络技术的研究热点。由于组播路由算法和协议是实
该文研究了两种基本的三维图形多分辨率模型,即基于小波的多分辨率模型和基于累进网格的多分辨率模型,并对两种多分辨率模型进行仿真实现.在基于小波的多分辨率模型方面,该文
本课题首先介绍了RBAC(Role Base Access Control)模型并对其进行扩展,根据实际需要建立时间敏感的角色存取控制的TRBAC模型和资源敏感的角色存取控制的RRBAC模型。 然后分
随着社会信息化的发展,条码技术在物流、证件管理、防伪和电子商务等领域中得到了广泛的应用,大大提高了生产工作效率。手机和二维条码技术的结合形成了一个新的热点领域——
随着社会经济和信息技术的飞速发展,现代社会正在向知识经济和知识社会转型。随着人们对知识需求的日益强烈,知识服务这一概念被提出,并得到了快速的发展。随着软件开发技术