词汇相似度约束的短语抽取

来源 :哈尔滨工业大学学报 | 被引量 : 0次 | 上传用户:baoxiuli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为克服传统的短语抽取方法对词对齐信息的依赖性强,抗噪声能力差这一缺陷,提出基于词汇相似度约束的短语抽取策略;在此框架下,提出了3种基于词汇相似度的约束方法:Dice系数、Phi平方系数和对数似然比.在IWSLT2004语料上进行的实验表明,3种基于词汇相似度的约束方法的翻译系统的BLEU评分均优于传统的翻译系统;其中基于对数似然比方法得到的翻译模型比基线系统Pharaoh的BLEU-4评分提高了15.14%.
其他文献
随着工业化、城市化的发展加快和农用化学物质种类、数量的增加,我国重金属污染日趋严重,重金属能通过食物链给人体健康带来威胁,重金属污染尤其是几种重金属的复合污染问题越来
对黑龙江省世居少数民族传统体育现状进行调查,讨论世居少数民族传统体育文化诸多因素,分析少数民族体育文化资源的传承与发展等问题,满足于少数民族传统体育文化发展的需要.
<正>目前,表面沉积物(CMAS)引起热障涂层的失效受到越来越多的关注,CMAS是指包括空气中以CaO-MgO-Al2O3-SiO2为主要成分的尘埃,沙砾,火山灰等。发动机叶片表面温度越来越高,
会议
给出了基于非结构动网格的非定常流动问题的数值模拟方法,重点说明两种动态非结构网格方法的原理以及在非定常流模拟中的算法。一种是基于非结构网格的重叠网格方法,该方法结
随着我国图书馆事业的发展,对图书馆馆员的素质和能力要求越来越高。图书馆馆员的继续教育工作势在必行。以美国、日本等发达国家为借鉴,针对我国图书馆馆员继续教育中存在的
近年来,合肥大力实施人才强市战略、创新驱动发展战略,坚持以高质量人才支撑高质量创新,以高质量创新引领高质量发展,取得了明显成效。引进外国人才和智力工作主动融入科技创