基于标志词的汉英EBMT研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zhouheknight
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文使用语言学中的标志词假设来指导汉英翻译单元的抽耿,取得了较好的抽取效果。本文从以下三个角度对标志词在汉英EBMT中的应用进行了研究:1.在介绍了目前已经使用的英语标志词后,提出了汉语的标志词,并通过对一个较大文本的统计信息证明了这些标志词的分割句子相对独立单元的作用。2.在确定了汉语标志词的基础上,本文提出了三种基于标志词和词语对齐的汉英翻译单元抽取方法,经后来的实验验证,这些方法、尤其是第三种方法取得了较好的翻译单元抽取效果。3.提出了翻译单元的质量评价和系统集成评价相结合的评价策略。首先提出了翻译单元的质量评价原则和质量划分,并在此基础上对本文提出的翻译单元抽取方法的抽取结果进行了评价,证明了这些方法的有效性。而后在系统集成评价证明了这些翻译单元可提升翻译系统的性能。从而证实了标志词假设应用在翻译单元抽取中可取得较好的效果。
其他文献
动态环境下的多机器人行为规划是本论文的论述重点,具体的实现和实验环境是RoboCup小型组机器人足球比赛。这篇论文包括以下内容:RoboCup小型组的背景知识类似研究成果介绍中国
实时交通流数据的采集,包括车流量统计、车道平均车速、车型识别分类等,在智能交通监控系统中起着重要的作用。交通流检测器有电磁感应线圈、超声波检测器、微波监测器和红外
近年来,XML在数据表示和交换上扮演越来越重要的角色,其存储也受到更多数据库的支持。XML成为被广泛应用的逻辑数据模型。XML与数据库技术开始有了融合,对XML所代表的信息建
自然语言处理是计算机科学中一个引人入胜、富有挑战性的课题。它的任务是建立一种能够模拟人类语言认知过程的计算模型。但是当前计算机的智能水平还远远不能与人类相提并论
随着计算机网络技术的发展,人们对网络传输数据的安全性要求越来越高。传统的加密体制使用同一个密钥进行加、解密,要求在传输密文的同时也要将密钥传输给接收者,这就增加了
图像的显著性是以区域的形式表现出来的,是指图像中最引人注意且最能表现图像内容的部分。显著性检测就是通过模拟人类视觉系统将图像中的显著部分提取出来的过程。图像显著
网络多媒体监控系统是一个集多媒体信息的综合性、计算机的交互性、通信的分布性和监控的实时性等技术于一体的综合系统。针对当前的网络多媒体监控系统具有部署困难、跨平台
随着虚拟现实硬件设备以及虚拟现实技术的发展,虚拟现实不仅在科研和设计等领域应用广泛,在科技展示领域也得到了越来越多的应用。应用了虚拟现实技术的科技展品比传统的科技
互联网是个巨大的信息资源库,从这个资源库中提取和检索出有用信息是个很重要的课题。搜索引擎是通用的信息检索服务。 搜索引擎一般由Crawler、索引库、检索器和用广接口
当今世界是一个信息时代,不管是在移动社交还是在移动电子商务、物联网平台,PUSH(推送)技术都得到了很大的应用,另外,Push技术改变了传统的“拉”信息的方式,使信息主动寻找用户,更适