基于语料库的最小求交词对齐

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:sztsb99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于句子级对齐的双语语料库的英汉词对齐方法.它建立在句对的集合表示形式的基础上,通过最小求交模型实现词对齐.使用倒排索引表和集合运算实现高效的最小求交算法.在对齐过程中引入高频干扰词表以提高召回率.实验结果表明,该方法优于使用共现互信息的词对齐和使用双语词典的词对齐方法.
其他文献
本文考虑具有线性无约束控制的最优控制问题.我们把这个问题变换成非线性问题,古典方法对求解这类非线性问题是有效的,从而提出改进算法.改进算法中用连续函数构造了系统的分
一、基本要求机械化插秧总体上要做到插深一致,达到不漂不倒,深浅适宜。插秧机作业常用指标有:全漂率不大于4%,翻倒率不大于4%,漏插率不大于5%,勾秧率(指机插后茎基部有90%以上
一、发展现状泰安市经济作物以花生、马铃薯、地瓜为主,花生种植区主要分布在丘陵山区新泰市、宁阳县、岱岳区.马铃薯种植区主要在肥城市。花生播种机械2011年保有量达到10374
有关安全操作系统在安全领域中应用的介绍很少,本文以我们开发的一种安全操作系统的实际应用为例,较全面的对安全操作系统的应用加以分析.其间给出了各类安全软件在整个信息
针对异构环境下独立任务分配问题,提出了一种免疫遗传算法,为抑制早熟停滞现象,基于免疫原理,为遗传算法定义了染色体浓度,采用免疫变异算子来维持种群的多样性,采用接种疫苗算子来
农机购置补贴既是强农惠农政策,又是一项产业促进政策。通过补贴政策的实施,对于进一步调动农民积极性,优化农机装备结构,提高薄弱环节农机化水平,加快农机化发展步伐,全面提