基于集成学习的最小错误率训练算法

来源 :厦门大学学报(自然科学版) | 被引量 : 0次 | 上传用户:mylocoy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最小错误率训练是统计机器翻译的标准调参方法,在统计机器翻译建模过程中发挥着重要作用.然而,该方法在训练过程中容易出现训练过拟合现象,即开发集训练得到的权重无法很好地适用于翻译测试集.针对该问题,本文引入集成学习方法来优化调参.在调参时挑选不同的特征子集来训练多组特征权重,并计算权重之间的空间距离以删除不合理的特征权重,再根据各组子集在开发集上的BLEU(bilingual evaluation understudy)值来进行加权平均,获得最终的特征权重.NIST和IWSLT实验结果表明,该方法具有较好的效果.
其他文献
本文以奥康纳的基督信仰为基石,结合叙事研究,通过解析不同人物的命运安排,力图探寻《好人难寻》的信仰责任并正确解码作者意图,发掘其暴力情节下的深层信仰救赎。 Based on
从修辞学的角度分析陆文夫小说《美食家》的语言表现艺术,分别从语音修辞、词语修辞、修辞格三个角度进行研究。语音修辞主要包括叠音词、象声词、双声叠韵修辞、儿化、押韵
斯蒂芬·克莱恩是美国19世纪很有影响力的作家,《红色英勇勋章》是他的一部代表作,也是美国文学史上的一部经典之作,在《红色英勇勋章》中有一系列的象征,这些象征将自然主义
在传统“冲突说”的影响下,人们对戏剧本质的探讨往往局限于社会矛盾,而相对忽视戏剧的完整结构。本文以戏剧形式和戏剧形态为核心问题,提出“情境”才是戏剧完整的结构形式,
人类社会生活中,最原始、最基本的区别是两性之别,这种区分体现在日常行为中的诸多方面,与两性的取名文化亦存在种种联系。本文以文学作品中的取名文化为视点,以男女名字中的习惯
《红字》是美国著名作家纳撒尼尔·霍桑的代表作,女主人公海斯特·白兰追求真爱,崇尚天性,而她生活的清教社会排斥感情,禁止欲望,海斯特的内心渴望遭到了现实的无情拒绝,但她没有倒
笔者在阅读大量现代汉语书籍和前辈所研究的文章基础上,根据在济南生活了二十余年的生活经验和亲身经历,对济南方言中那些不同于普通话的特色程度副词依照使用频率进行了总结和
近年河南安阳发现了“曹操墓”,历来聚讼不已的曹操是否姓曹的问题又起争论。本文以卢弼《三国志集解》及王先谦《后汉书集解》为基本文献,从探讨后汉时代宦官封爵、养子袭爵等
莫言,第一位获得诺贝尔文学奖的中国作家。代表作有《红高粱》《丰乳肥臀》《檀香刑》《生死疲劳》等,其中为大众广泛熟知的要属多次被搬上大荧幕的《红高粱》。从莫言的作品中
中国民众的英雄崇拜心理从古就有,而且至今犹存。我们在不少历史传说、名著、武侠小说中都能找到英雄的影子,而且英雄的属性无非正直正义。他们身上赋予了广大人民群众对他们理