基于短语相似度的统计机器翻译模型

来源 :高技术通讯 | 被引量 : 0次 | 上传用户:limingxhss2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对基于短语的统计机器翻译(SMT)模型中由于采用精确匹配策略导致的短语稀疏问题,提出了一种基于短语相似度的统计机器翻译模型。该模型将基于实例的翻译方法引入到统计机器翻译中。翻译时,对于训练语料库中未出现过的短语,通过计算源语言短语之间的相似度,采用模糊匹配策略从短语表中查找相似的实例短语,并根据实例短语为其构造翻译。与精确匹配策略相比,利用相似度进行模糊匹配增加了对短语表的利用程度,缓解了短语稀疏问题。实验表明,该模型能够明显地提高统计机器翻译的质量。效果超过了当前最好的短语系统“摩西(Moses)”。
其他文献
结合水布垭工程高面板堆石坝监测技术和监测仪器所反映的实际问题,分析了适应高面板堆石坝监测的新技术,对光纤测渗流技术、超长水平、垂直位移计和光纤陀螺仪测面板挠度等技
务坪水库坝轴线上游右岸不稳定山体及左岸3号滑坡体的处理是其建坝的技术难点之一.在进行岸坡处理方案的研究论证中,充分考虑了工程的实际情况,将岸坡加固处理措施与坝体结构
从阳高县马铃薯生产的现状入手,重点分析了马铃薯产业化发展的优势和存在的问题,并提出了今后产业化发展的具体措施和方向。
对高校图书馆实施"全开放、一体化"管理模式后存在的诸多问题进行了分析,探讨了"知识服务与环境育人"双目标价值取向的高校图书馆管理模式,对"全开放、一体化"管理模式提出若干改进
为建立准确实时地定量检测病毒性出血性败血症病毒(VHSV),在VHSV-N基因保守区设计了TaqmanMGB探针与引物对,随后,采用体外转录技术获得了VHSV-N基因RNA,并以此为绝对定量标准品,建立
许多研究成果表明,影响水轮机水力稳定性有多种因素,其中一个重要因素是尾水管内水流的压力脉动.由于各种原因产生的高频和低频的压力脉动会使尾水管内部产生严重的空蚀破坏
由于水电厂的自动化程度越来越高,设备的在线监测和故障诊断就显得越来越重要.从实际应用的角度分析,水电机组的在线监测和故障诊断专家系统应具有巡检、特况记录、波形采集
在容错计算中,检查点技术的使用可以使进程在失效后恢复到一个最近状态,从而有效控制计算损失。考虑进程在计算过程中可能对一些外部资源进行操作,如对文件进行更新,进程恢复时若
本文通过走访调查洛阳平乐村收入情况,从农民收入结构方面给出了促进农民增收的几点建议:加强农业基础设施建设,提高农业科技化、规模化、集约化水平;鼓励和支持非农产业的发
提出了一种可以在长骨骨折手术前获取目标固定钢板几何参数的仿真方法。该方法主要包括以下步骤:通过CT扫描获取骨折部位的序列断层图像,利用Curvelet变换对CT序列图像进行去噪处理并建立三维模型;根据长骨的形状特征,提取两个断骨的轴线进行空间配准,并驱动两个断骨进行模型预配准;使用网格顶点法矢特征分割得到两个断骨截面;采用基于非迭代估计的配准方法对两个断骨截面进行配准操作,并驱动两个断骨进行模型精