基于对偶分解的词语对齐搜索算法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:lyhyes
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词语对齐旨在计算平行文本中词语之间的对应关系,对机器翻译、双语词典构造等多项自然语言处理任务都具有重要的影响。虽然近年来词语对齐在建模和训练算法方面取得了显著的进展,但搜索算法往往都采用简单的贪心策略,面临着搜索错误较大的问题。该文提出了一种基于对偶分解的词语对齐搜索算法,将复杂问题分解为两个相对简单的子问题,迭代求解直至收敛于最优解。由于对偶分解能够保证求解的收敛性和最优性,该文提出的搜索算法在2005年度863计划词语对齐评测数据集上显著超过GIZA++和判别式词语对齐系统,对齐错误率分别降低4.2%
其他文献
同一个字符拥有不同的计算机内部代码,这意味着有两个或两个以上字形在人的眼中是同一个字,而计算机却认为是不同的字。这种"人机看法不一致"会给语言信息处理带来混乱,导致信
意法半导体(ST)与韩国现代半导体(Hynix)日前宣布双方签署了在中国江苏省无锡市合资建立一家存储器前端制造厂的合资企业协议书。新的晶圆厂将专门用于制造DRAM和SAND闪存,以
在上篇文章里,我们谈到西方世界进入现代社会后,伴随着两次世界大战和一次全球经济危机,不得不进行相关的调整,并由此产生了社会主义思潮的兴起.在本文中我们再来看其他国家
自一九七八年我国推行全面质量管理二十多年来,QC小组活动在全国各个领域得到了蓬勃发展.该项活动在提高产品质量、降低物料消耗、增加经济效益和企业素质等方面取得了很大成
目的 探讨电视胸腔镜治疗自发性气胸的疗效、手术注意点及术后并发症的预防.方法 术中据探查情况及肺大泡大小分别应用圈套结扎、缝合器切割等方法切除肺大泡.对于弥漫性病变
去年11月召开的党的十八届三中全会,掀开了中国改革开放新的篇章,标志着中国进入全面深化改革的历史新阶段,对于全面建成小康社会、实现中华民族伟大复兴的中国梦具有重大而
期刊
这里所谓“农口”,是当时国务院有关农业农村工作部门的统称,包括农业部、林业部、水利部、农机部、供销总社、气象局等单位。当时九号院的工作人员,特别是局、处级干部,大多
介绍了一种简单实用的压阻式传感器零点温度误差补偿技术在恒流源供电下,可用计算机同时采集多个待补偿传感器的输出电压和电桥输入端电压,即可通过软件自动计算出补偿电阻的
该文对藏语拉萨话单音节的嗓音特征进行了实验研究,实验首先对藏语拉萨话单音节进行语音标注,然后根据语音标注的位置信息,利用对应的程序提取音节结构中的元音和辅音的嗓音