基于短语相似度的统计机器翻译模型

来源 :高技术通讯 | 被引量 : 0次 | 上传用户：limingxhss2

【摘要】

：

针对基于短语的统计机器翻译（SMT）模型中由于采用精确匹配策略导致的短语稀疏问题，提出了一种基于短语相似度的统计机器翻译模型。该模型将基于实例的翻译方法引入到统计机器翻

【作者】

：

何中军刘群林守勋

【机构】

：

中国科学院计算技术研究所中国科学院智能信息处理重点实验室,中国科学院研究生院

【出处】

：

高技术通讯

【发表日期】

：

2009年4期

【关键词】

：

相似度基于短语的统计机器翻译基于实例的机器翻译 similarity phrase-based statistical machine translati

【基金项目】

：

863计划（2006AA010108）和国家自然科学基金（60573188,60603095,60736014）资助项目.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对基于短语的统计机器翻译（SMT）模型中由于采用精确匹配策略导致的短语稀疏问题，提出了一种基于短语相似度的统计机器翻译模型。该模型将基于实例的翻译方法引入到统计机器翻译中。翻译时，对于训练语料库中未出现过的短语，通过计算源语言短语之间的相似度，采用模糊匹配策略从短语表中查找相似的实例短语，并根据实例短语为其构造翻译。与精确匹配策略相比，利用相似度进行模糊匹配增加了对短语表的利用程度，缓解了短语稀疏问题。实验表明，该模型能够明显地提高统计机器翻译的质量。效果超过了当前最好的短语系统“摩西（Moses）”。

其他文献

水布垭高面板堆石坝监测新技术探讨

结合水布垭工程高面板堆石坝监测技术和监测仪器所反映的实际问题,分析了适应高面板堆石坝监测的新技术,对光纤测渗流技术、超长水平、垂直位移计和光纤陀螺仪测面板挠度等技

期刊

高面板堆石坝水布垭工程垂直位移监测仪器渗流修建水平超长挠度结合水

务坪水库不稳定山体及滑坡体的处理研究

务坪水库坝轴线上游右岸不稳定山体及左岸3号滑坡体的处理是其建坝的技术难点之一.在进行岸坡处理方案的研究论证中,充分考虑了工程的实际情况,将岸坡加固处理措施与坝体结构

期刊

振冲加固反压平台岸坡临空面务坪水库vibroflotation reinforcement back-pressure platform abut

阳高县马铃薯生产现状及发展研究

从阳高县马铃薯生产的现状入手,重点分析了马铃薯产业化发展的优势和存在的问题,并提出了今后产业化发展的具体措施和方向。

期刊

马铃薯产业化发展阳高县potatoes industrialized development Yanggao County

“服务与育人”双目标价值取向下的高校图书馆管理模式新探

对高校图书馆实施＂全开放、一体化＂管理模式后存在的诸多问题进行了分析,探讨了＂知识服务与环境育人＂双目标价值取向的高校图书馆管理模式,对＂全开放、一体化＂管理模式提出若干改进

期刊

高校图书馆环境育人管理模式university library environment education management mode

Taqman MGB探针快速定量检测VHSV方法的研究

为建立准确实时地定量检测病毒性出血性败血症病毒（VHSV），在VHSV-N基因保守区设计了TaqmanMGB探针与引物对，随后，采用体外转录技术获得了VHSV-N基因RNA，并以此为绝对定量标准品，建立

期刊

病毒性出血性败血症病毒(VHSV)TAQMANMGB探针荧光RT—PCR法定量检测viral hemorrhagic septicemia virus

尾水管脉动压力及扩散方式的研究

许多研究成果表明,影响水轮机水力稳定性有多种因素,其中一个重要因素是尾水管内水流的压力脉动.由于各种原因产生的高频和低频的压力脉动会使尾水管内部产生严重的空蚀破坏

期刊

尾水管脉动压力扩散方式空蚀水轮机主频率pressure fluctuationsstrength coefficientmai n freque

水电机组在线监测技术与故障诊断专家系统

由于水电厂的自动化程度越来越高,设备的在线监测和故障诊断就显得越来越重要.从实际应用的角度分析,水电机组的在线监测和故障诊断专家系统应具有巡检、特况记录、波形采集

期刊

水电机组在线监测故障诊断专家系统自动化hydropower units on-line monitoring fault diagnosis e

一种无文件恢复的检查点算法

在容错计算中，检查点技术的使用可以使进程在失效后恢复到一个最近状态，从而有效控制计算损失。考虑进程在计算过程中可能对一些外部资源进行操作，如对文件进行更新，进程恢复时若

期刊

容错分布式文件系统检查点文件语义fault-tolerance distributed file system checkpoint file s

农民收入结构与增收问题研究——基于洛阳平乐村农民收入调查的视角

本文通过走访调查洛阳平乐村收入情况,从农民收入结构方面给出了促进农民增收的几点建议：加强农业基础设施建设,提高农业科技化、规模化、集约化水平;鼓励和支持非农产业的发

期刊

农民收入结构增收农业基础设施农村剩余劳动力farmers income structure increasing income agric

基于断骨轴线预配准的长骨骨折钢板预弯

提出了一种可以在长骨骨折手术前获取目标固定钢板几何参数的仿真方法。该方法主要包括以下步骤:通过CT扫描获取骨折部位的序列断层图像,利用Curvelet变换对CT序列图像进行去噪处理并建立三维模型;根据长骨的形状特征,提取两个断骨的轴线进行空间配准,并驱动两个断骨进行模型预配准;使用网格顶点法矢特征分割得到两个断骨截面;采用基于非迭代估计的配准方法对两个断骨截面进行配准操作,并驱动两个断骨进行模型精

期刊

自动配准轴线长骨骨折钢板预弯automatic registration axial ＇line long bone fracture plat

基于短语相似度的统计机器翻译模型

与本文相关的学术论文