基于树到串对齐模板翻译模型的n-best解码算法

来源 :第九届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户:jasonzheng1978
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于树到串对齐模板的统计机器翻译模型是一种新颖的翻译模型,本文提出了基于树到串对齐模板翻译模型的n-best解码算法。实验结果表明,本文提出的解码算法不但提高了开发集上的oracleBLEU值,而且使得最小错误率训练程序能够训练得到更好的模型参数,从而改进了整个翻译系统的翻译质量。
其他文献
本文主要介绍了中文阅读理解语料库的构建过程,重点介绍了语义标注的过程,内容包括对文章的筛选、问句的设计、指称指代标注、框架语义标注、以及语料库评测标准等相关工作的
HNC团队在建立词语知识库的过程中.逐步建立起以句类体系为指导的现代汉语句库。HNC句库为动词配备了丰富而真实的例句,充分展现了动词的意义和用法。本文介绍了HNC句库的基
本文在提出标点句的基础之上,讨论了标点句的研究内容及意义,重点论述了标点句的标注问题。基于易视性、自动形成树形结构、便于扩充三原则,我们提出一种用于标点句研究的不
汉语篇章修辞结构标注项目CJPL依据修辞结构理论(RhetoricalStructure Theory, RST),定义了汉语篇章修辞分析的基本单元和修辞关系集,草拟了篇章结构标注工作守则、标注工作
在统计机器翻译系统的解码过程中,经常会出现训练语料中没有的"未登录词",这些词的出现严重地影响了解码器的速度和整个系统的性能,为此,本文通过对未登录词现象及其同义词的
双语语料库在机器翻译研究中是非常重要的。本文探讨了如何利用蒙英双语语料进行蒙英翻译片段对的抽取,在蒙英两种语料进行词性标注处理之后,利用假设-检验的方法通过词语关
该文提出了基于二部图的词对齐模型:利用二部图为双语句对建模,利用词形、语义、词性和共现等信息计算单词间的相似度,利用加权二部图最大匹配获得最终对齐结果。实验表明,该
采用根癌农杆菌介导法的叶盘转化法,将紫穗槐反义4CL基因片段导入烟草中,获得T0代阳性转化植株.T0代转基因植株自花授粉,收获种子,种植后获得T1代植株.PCR、RT-PCR (T1代)检
指出双语组块最重要的特点是语义自足性、结构合法性和翻译转换的充分性,即识别出来的"双语组块"包含有确定的语义信息和双语对译信息,并且符合-定的语法规范。为此,相应地提
会议
从1986年以后每年人们郡像往常一样来到切尔诺贝利核事故纪念碑前哀悼死难者.人类对自然和科学的掌握.创造了更好的生活,也带来了不少灾难.环境的污染和资源的流失,威胁到了