泛化语言模型在汉维机器翻译中的应用

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:cuifangcuifang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对汉维统计机器翻译中维吾尔语具有长距离依赖问题和语言模型具有数据稀疏现象,提出了一种基于泛化的维吾尔语语言模型。该模型借助维吾尔语语言模型的训练过程中生成的文本,结合字符串相似度算法,取相似的维文字符串经过归一化处理抽取规则,计算规则的参数值,利用规则给测试集在解码过程中生成nbest译文重新评分,将评分最高的译文作为最佳译文。实验结果表明,泛化语言模型减少了存储空间,同时,规则的合理使用有效地提高了翻译译文的质量。
其他文献
目的观察慢性鼻-鼻窦炎(CRS)病人局部组织中Th9细胞效应因子白细胞介素-9(IL-9)、白细胞介素-10(IL-10)的含量,探讨Th9细胞在CRS发病中的作用。方法采集45例CRS病人鼻内镜手术后筛
以一宗道路交通事故驾乘关系鉴定为例,利用现场现存部分及其他证据,通过合理的逻辑推理、分析及相互验证的步骤,得出现场重建的科学结论,以揭露事实真相。
<正>出版社:法律出版社托马斯·达恩史戴特专研警察法、公民权及国际法,数十年来持续为德国《明镜周刊》供稿,也曾主编该刊的德国政治版数年。著有《空洞的共识:共和该怎么重
<正>现批准《工程测量规范》为国家标准,编号为GB50026-2007,自2008年5月1日起实施。其中,第5.3.43(1)、7.1.7、7.5.6、10.1.10条(款)为强制性条文,必须严格执行。原《工程测
4月1日起,外国人永久居留证件便利化改革正式启动.“新政”为更好地吸引留住外籍人才,降低了外国人永久居留制度门槛,为外国高端人才来华工作开辟了方便快捷的绿色通道.
通过对渤海湾盆地新近系生储盖、圈闭及输导等条件的研究,探讨不同凹陷新近系油气成藏条件的差异,并建立3类油气聚集模式.研究表明:渤海湾盆地新近系油气成藏具有它源供烃、储
【正】 一 唐代建国近三百年,以敦煌地区历史而言,自然地划分为三段:唐王朝直接控制时期(武德初至建中二年,六一八——七八一年),吐蕃统治时期(建中二年至大中二年,七八——
纵观图书的历史发展,岩画被泥版书取代,泥版书让位于动植物皮书,而纸张的出现使印刷的图书占据主流,每一个新的发展都是对前者的淘汰。那么现在崭露头角的电子书 (E-book) 会
<正>编辑同志:我2009年2月被聘为某食品加工有限公司的技术员,与公司约定月工资为2800元,未签订书面劳动合同。2010年3月,我与公司协商后补签了5年期书面劳动合同。2011年7月
针对双电机驱动的带式输送机采用传统的控制方式,电机启动电流过大、各电机的输出功率不平衡、双电机无法协调同步控制等问题,提出了采用一整流、两逆变组合式双机驱动变频控