基于短语统计机器翻译系统的研究

被引量 : 0次 | 上传用户:dt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
年来,统计方法在机器翻译中的应用得到了广泛的关注,各种统计模型不断涌现,统计机器翻译系统的性能得到了很大的提升。在近年举行的机器翻译评测中,统计机器翻译系统取得了很好的成绩。统计方法已逐渐成为机器翻译研究的主流方法之一。本文首先对统计机器翻译若干主要方法进行了研究和探讨,包括基于信源信道思想和基于最大熵思想的若干模型。本文详细讨论了基于短语的统计机器翻译系统的设计和实现。在统计机器翻译领域,基于短语的翻译模型的性能优于基于词的翻译模型。目前在基于短语的所有机器翻译模型系统中,源语言都是以均匀分布的方式进行短语切分,然后将所有可能的短语切分结果送入解码器,最终得到翻译结果。遗憾的是,这种基于均匀分布模型对源语言进行短语切分的方式没有充分结合源语言的语言学知识,可能会误导翻译模型以致选择错误的候选目标短语。本文提出通过对源语言知识进行统计学习,获得短语切分概率模型,以指导对源语言进行合理的短语切分。短语切分概率模型可以独立成为一个新的特征,因此能够非常容易的嵌入以最大熵模型为框架的主流统计机器翻译系统中。通过对中英翻译和法英翻译的实验评测,证明了该方法可以明显改善统计机器翻译系统的性能。在各种短语翻译模型中,基于对齐模板的短语翻译模型和标准短语翻译模型是典型代表,二者在翻译过程中分别使用对齐模板和短语对,本文首先对这两种模型进行了全面对比。对齐模板和短语对各有优势,对齐模板能够较好处理数据稀疏的问题,短语对可以使翻译更加精确。本文提出在基于最大熵的标准短语翻译模型下模拟对齐模板,模拟的对齐模板被作为一个单独的特征函数加入到此翻译模型中。实验在中英翻译和法英翻译上进行,实验结果证明了本文方法明显改善了标准短语翻译模型的翻译效果。
其他文献
通用视觉测量机器人是视觉检测技术在工程应用中一个非常有意义的研究领域。该系统主要由工业机器人和视觉传感器组成,它保留了视觉检测技术非接触、测量迅速的特点的同时,还
对江苏省6所高校的1 244名在校大学生采用分层整群随机抽样调查,了解大学生体质水平现状,把握影响大学生体质健康的行为危险因素和保护因素,探寻大学生体质健康与危险行为干
目的了解我国乡镇卫生院院长的管理培训需求及培训现状,发现其在管理工作的薄弱环节,建立科学合理的管理培训方案,并提出实施策略。方法在查阅大量文献资料的基础上,通过亨利
本论文以消费者行为学为理论依据,采用文献资料和问卷调查等方法,对成都市不同学历层次大学生体育消费行为的决策过程进行调查研究,旨在了解大学生体育消费中存在的问题,通过
言论自由是一个社会极为重要的品格和价值之一,因为宽容、自由的氛围可以提供个人智性健康成长和社会和谐发展的基础。所以,言论自由被视为公民的基本人权,以宪法性法律加以
钢结构住宅在欧美已经有几十年历史了,凭着其良好的特性,迅速发展。本文在当前我国住宅产业迅速发展的背景下,基于钢结构住宅技术的初步研究,探索钢结构住宅未来可持续发展方
科技型中小企业是我国国民经济的重要力量和经济发展的增长点。据国家发展与改革委员会2004年6月发布的数据显示,我国约65%的专利由科技型中小企业发明,75%以上的技术创新由
随着钛白粉制备工艺的不断进步和新产品的不断开发,生产具有优异的光学性能和颜料性能的产品成为世界钛白粉工业的发展趋势。目前国内的钛白粉生产,绝大多数还是以硫酸法工艺
<正>从2002年以来,江苏省消防总队每两个月召开一次消防执法工作例会,对消防工作进行阶段性的总结和部署,会议已成惯例。与以往不同的是,这一次召开的执法工作例会,不再是例
以研究试验龄期和试件尺寸对钢纤维混凝土抗折强度的影响为目的,通过不同尺寸、不同钢纤维体积率混凝土试件的抗折强度试验,研究了钢纤维混凝土试件之间的强度关系,并按照定