基于统计的模糊翻译记忆关键技术研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:ygp313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的翻译记忆系统由于翻译记忆库的规模以及翻译任务的文本重复率有限,只有在进行特定翻译任务时才能较好发挥翻译记忆的优势。而面对大规模并且不限定领域的翻译任务时,往往由于翻译记忆库的不完备导致翻译能力受限。本文通过在统计机器翻译系统中融入翻译记忆系统的相关信息,提出了一种融合统计机器翻译和翻译记忆的整合式模型。和目前的统计机器翻译系统不同,本文首先以待翻译文本为依据,在翻译记忆库中检索匹配到相关片段作为参考。将参考的翻译记忆和待翻译文本同时输入到翻译系统中,通过参考翻译记忆片段对解码过程进行指导,对解码过程中的翻译候选进行重排序工作,使得和翻译记忆片段含有共现词的翻译假设获得较高得分,从而有更大概率出现在系统最终翻译结果中。本文系统以IWSLT2010评测数据为数据集,在性能上高于传统的翻译记忆系统以及统计机器翻译系统。系统的最终翻译结果在流畅度上要优于统计机器翻译系统结果,同时不需要人工介入即可应用翻译记忆内容,具有较好的应用前景。
其他文献
沉积物作为水体重金属最主要的“汇”,其成分和结构相对稳定,不易发生变化,因此在一定程度上能够反映水环境的污染状况。而重金属在沉积物中的赋存形态直接影响其在环境中的化学行为和潜在生物毒性,所以重金属在河流沉积物中不同赋存形态的分布特征研究,可用于探讨其迁移规律。本文基于BCR多级连续提取法,对西藏拉萨河流域表层沉积物中重金属不同形态进行提取,并采用电感耦合等离子体质谱仪分析测定了(包括Al、As、A
本文采用Novy(2013)模型,测度了制造业的省际贸易成本,结果表明:我国西部贸易成本最高,东部最低;部分行业的省际贸易成本有所上升,但整体上变化趋势不大;通过引力模型对边界效应
城市交通运输是城市经济、社会发展的重要条件,没有城市交通运输,各种城市构成要素势必处于静止状态,城市就难以形成综合动态的有机体。随着城市现代化进程的加快,越来越多的
学位
西藏阿里地区噶尔、普兰、扎达三县1994年动物鼠疫监测蒋志勇,次仁顿珠(西藏自治区地方病防治研究所,拉萨850000)才旺加措,吾金多吉,云旦顿珠,中尼玛次仁,次仁达吉(阿里地区卫生防疫站,狮泉河859000)根据
目的:初步探讨蒙医对中风先兆证的认识和蒙药防治的效果.方法:文献研究角度对中风先兆证提出初步认识.实验采用家兔随机分为脑缺血模型(盐水)组、蒙药(额尔敦-乌日勒、嘎日迪
[目的]评价别直参对MCF-7细胞体外增殖的影响,并检测其对凋亡相关蛋白bax/bcl-2表达的影响。[方法]采用MTT比色法检测对MCF-7细胞增殖的作用;流式细胞术检测对MCF-7细胞凋亡
采用专题小组讨论方法首次在新疆南疆进行防治碘缺乏病健康教育调查研究。结果表明:1.乡镇居民对碘缺乏及其危害认识肤浅;2.经济困难及传统习惯仍是许多居民食用土盐和阻碍普及加
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
现阶段社会舆论的传播途径多数依靠互联网平台,在大量信息快速传播的环境下,不免出现了道德绑架的现象。本文首先阐述了互联网新闻传播中产生道德绑架现象的原因,并分析了规
传统的研究生培养模式较为单一,研究生在受教育期间综合能力不能得到很大的提高,甚至出现部分研究生“高分低能”现象,不利于其今后的发展。为了满足社会的需求,探索新型研究