统计机器翻译中的非连续短语模板抽取及其应用

来源 :计算机科学 | 被引量 : 0次 | 上传用户:dakeke
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前基于短语的统计机器翻译模型很少将非连续短语的情况考虑在内,由此造成翻译结果在目标语言中的意义变化或缺失。以非连续介词短语为例,提供了一种短语模板抽取算法。首先采用基于规则的方法,抽取出中文非连续介词短语模板,而后借助双语对齐语料和介词一方位词翻译表,获得模板对应的英文翻译。最终形成的双语模板被加入短语翻译表中。在标准测试语料上的对比实验表明,加入非连续短语模板后,译文更加符合语法规范,而翻译结果也取得了相对稳定的提高。
其他文献
在语义理解的基础上检索出满足用户需求的信息,是P2P走向更广泛应用的关键技术之一。提出了一种支持语义的混合P2P网络模型M-Chord,采用基于元数据规范模板(MsT)的语义描述模型,结
利用气相色谱-飞行时间质谱,对安息香膏的挥发性成分进行分析,并用峰面积归一化法计算各成分相对含量。利用在两种不同极性色谱柱上的比较试验,确定了适合安息香膏分析的色谱柱
入侵检测系统的虚警率影响检测结果的可信性。通过分析入侵检测系统的可信问题及异常入侵检测系统的虚警率问题,提出了降低虚警率的方法:基于进程检测行为的入侵检测方法、多检
本文在深入分析国内外开展的下一代Internet(NGI)或下一代网络(NGN)相关研究工作的基础上,重点研究了NGI/NGN体系结构及其服务质量保障机制。重点阐述了笔者所在的四川省网络通信技
为弥补传统属性约简模型的不足,一些学者提出了基于系统熵的属性约简和基于数据库模型的属性约简定义。基于数据库模型的属性约简的主要优点是能结合高效的数据库技术,使得相应
网络异构性与传输可靠性是视频通信存在的两大问题。在视频编码中,分层编码用来解决网络传输异构性问题,多描述编码是解决传输可靠性的有效手段,而分层多描述视频编码则是二者的
网格环境动态、多域和异构性的特点决定其需要灵活、易于扩展和精细的授权机制。近来在网格环境下的访问控制方面做了大量研究,现有的模型大多在相对静止的前提下,基于主体的标
已有基于内存的虚拟机迁移技术要求迁移源机和目标机之间必须共享网络磁盘,迁移性能受网络条件的影响很大,且在不支持“共享网络磁盘”的环境中,无法实现虚拟机迁移。针对上述问
提出了一种基于Spin-Image的鲁棒水印算法。首先通过Spin-Image变换,提取出网格模型的全局几何特征,同时实现几何数据的二维参数化,然后利用K-L变换对Spin-Image映射的方阵进行
时间性是现实世界数据库本身固有的因素,更是构成隐私数据的基本属性,把它作为约束条件,就可以研究更为真实的现实情况。基于隐私保护和数据安全的考虑,现将数据的时态特性与不同