粘贴模型在依存语法统计机器翻译中的应用

来源 :第十一届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户:QUEEN_ZX
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于依存语法的统计机器翻译中,由于依存文法的扁平化,随着节点数目的增多,解码过程中很难匹配到完整的规则,会有大量未覆盖节点需要进行粘贴操作,传统的粘贴操作采用邻近保序策略,但会在一定程度上造成译文顺序的混乱.本文构建了一个基于最大熵的粘贴模型,利用丰富的上下文信息指导译文粘贴.在NIST2005汉英测试集上的实验结果表明,使用粘贴模型能够有效的减少粘贴操作带来的错误影响,相对于基准系统提高了1.13个BLEU值。
其他文献
为了提高薄煤层综采工作面生产效率,降低生产一线工人的劳动强度,需要在综采工作面设计一套巡检自动化控制系统,改善液压支架自动跟机精度控制,改善采煤机跟机视频效果,提供
对GB/T 214-2007《煤中全硫的测定方法》中艾氏卡混合剂熔样-硫酸钡沉淀法测定煤中全硫测定结果的不确定度进行评定,通过对影响煤中全硫含量测定结果的不确定度分量进行分析
汉语分词是构建汉语到其他语言机器翻译系统的一项重要工作.基于单语的分词不一定完全适合机器翻译,一个适合于机器翻译所需要的分词方法,应该考虑到机器翻译所具有的双语特
会议
为有效解决救生舱在运输状态下、起落过程中的机械保护及平稳吊运问题,设计了基于组合式平行四边形结构的升放装置.针对升放装置工作过程中安装板后部弯曲变形,并导致其与救
为了更好地解决统计机器翻译中的调序问题,本文提出了基于句法信息、词性标注信息和规则相结合的源语言重排序模型作为统计机器翻译的预处理模块.该模型分为两种,一种是基于
以单个彗星纤维为研究对象,利用Workbench建立彗星纤维模型,并在Fluent中对彗星纤维过滤器进行数值模拟,分析研究了入口速度、纤维直径对压力损失的影响.研究发现:当入口速度
为了解潮州市传染病的实际发生情况 ,更好地贯彻执行《中华人民共和国传染病防治法》及其实施办法 ,潮州市卫生防疫站于 1 997年1 0月对全市各级医院法定传染病漏报情况进行
[例1]故障现象 接通电源开关,电源指示灯亮,按出盒键,带仓弹不出。 分析与检修 根据上述故障现象,可初步判断故障出在带仓机构或系统控制电路中。打开外壳检查带仓锁定机构,
本文提出一种基于句法的预调序方法来解决基于短语的汉英翻译系统中的调序问题.该方法使用训练语料的源语言句法树和词对齐信息来自动抽取调序规则,并用规则调整训练和测试语
自公元前314年开始,蜀道上出现了络绎不绝的跋涉者,他们之中,有豪强、富贾、罪犯、甚至还有秦相吕不韦。依靠这场持续百年的大迁徙,秦人完成了对蜀地的经济改造,在逐鹿中原征途中无疑已占得先机;而蜀地,也在此时完成了青铜时代向铁器时代的转变。    公元前314年,战争引发的迁徙      公元前314年已是战国中叶,这一年可谓多事之秋,燕国爆发“子之之乱”,齐国与中山国趁机联合攻燕,燕王与燕太子在动乱