主题模型在统计机器翻译中的应用

来源 :中国科技信息 | 被引量 : 0次 | 上传用户：wh13499599

【摘要】

：

在基于短语的统计机器翻译中，短语表是解码器工作的核心部分，它主要包含了源端和目标端短语的翻译概率和词汇互译概率；但传统的短语表数量庞大，并且领域自适应能力差。为了在解码

【作者】

：

巢佳媛贡正仙

【机构】

：

苏州大学计算机科学与技术学院

【出处】

：

中国科技信息

【发表日期】

：

2013年11期

【关键词】

：

统计机器翻译主题模型 LDA statistical machine translation topic model LDA

【基金项目】

：

苏州大学大学生创新训练计划项目（11cxxj048）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在基于短语的统计机器翻译中，短语表是解码器工作的核心部分，它主要包含了源端和目标端短语的翻译概率和词汇互译概率；但传统的短语表数量庞大，并且领域自适应能力差。为了在解码过程中挑选出更高质量的短语对．适当减少内存消耗和缩小解码空间，本文介绍了一个简单易行的基于主题模型的统计机器翻译系统的实现：首先使用LDA工具建立主题模型，然后把主题模型信息嵌入到短语表中，最后为解码器设计一个预处理模块可以使解码器不需要改变就可以在翻译过程中根据主题选择合适的短语对，从而提高了翻译的效率和质量。

其他文献

烟气排放连续监测系统的防雷研究

介绍了烟气排放连续监测系统的使用现状；依据雷电学原理及相关防雷技术规范，分析了烟气排放连续监测系统遭雷击的原因及其防雷方面存在的问题；综合运用隔离、屏蔽、合理布线、等

期刊

烟气排放连续监测系统防雷隔离屏蔽合理布线等电位联结接地continuous emissions monitoring systems （CEMS）

小鼠白介素-12真核表达质粒的构建及其表达

目的：构建能在真核细胞内稳定表达小鼠白介素-12（mIL-12）的质枉，为进一步研究mIL-12的免疫调节机制及其抗肿瘤作用奠定基础。方法：通过聚合酶链反应（PCR）扩增质枉pORF-mIL012（Elasti），

期刊

白细胞介素12小鼠质枉基因表达interleukin-12 mice plasmids gene expression

关于Zigbee定位参考节点布局方案的研究

在zigbee定位技术中,各种因素的影响会导致定位不精确。经实验表明,参考节点的布局位置会影响定位精度。因此,就针对参考节点布局位置,提出参考节点的布局方案,采用正方形、圆形、等边三角形的方式,分别对盲节点的坐标进行测量、分析,从而选取最优的布局方案,提高定位的精度。

期刊

ZIGBEE定位布局精度zigbee IocaJization layout accuracy

甘氨双唑钠提高肝动脉阻断结合外放射治疗大鼠肝移植瘤的疗效

目的:观察乏氧放射增敏剂甘氨双唑钠(CM)的应用能否提高肝动脉栓塞(TAE)结合外放射治疗肝肿瘤的效果.方法:采用大鼠肝内移植Walker256肿瘤模型,以肝动脉结扎(HAL)的方法阻断

期刊

肝肿瘤/放射疗法甘氨双唑钠肝动脉栓塞血管内皮生长因子liver neoplasm/radiotherapy metronidazol amino ac

高职校园网升级方案研究

随着Internet的迅猛发展及教育网络基础建设的全面实施，高校信息化、网络化为高职院校的建设和发展创造了新的契机。通过具体实例，对在原有基础上扩建改造校园网的设计思路和实

期刊

校园网技术方案网络拓扑

PHA对CIK细胞体外扩增影响的研究

目的:观察植物血凝素PHA对细胞因子诱导的杀伤细胞(cytokine-induced killer cells, CIK)体外扩增的影响.方法:在外周血单个核细胞定向诱导CIK细胞时加或不加PHA,观察细胞增

期刊

肿瘤免疫学杀伤细胞植物血凝素类基因扩增neoplasms/immunologykiller cellsphytohemagglutininsge

开放性实验室培养创新人才的实践与研究

本文以湖南涉外经济学院为研究对象，介绍了开放性实验室建设的必要性、开放措施以及在创新人才培养方面取得的成绩。对构建良好的实验室开放环境，提高学生的实践能力和创新能力

期刊

开放实验室创新人才培养实验室管理实验教学

微信公众平台搭建与开发揭秘

国内首本关于微信公众平台二次开发的著作．系统讲解了微信公众平台的各项高级功能的使用，以及二次开发的完整流程和方法：面向完全没有开发经验的读者．以实用为导向，旨在通过大量案

期刊

书刊发行工作微信公众平台IT行业发展现状

肝细胞癌组织中endoglin（CD105）和VEGF及p57^kip2表达与预后的关系

目的:探讨肝细胞癌(hepatocellular carcinoma,HCC)endoglin (CD105)、血管内皮生长因子(vascular endothelial growth factor, VEGF)和有丝分裂抑制因子(p57kip2)的表达与组

期刊

癌肝细胞病理学膜-糖蛋白类内皮生长因子有丝分裂抑制因子免疫免疫组织化学carcinomahepatocyte/pathologymembran

运用主成分分析法判断太阳能电池板对太阳能的要求

利用主成分分析法，分析太阳能小屋周围的光照强度之间的强弱影响，鉴于此基础来安装太阳能电池板，并用山西大同典型气象年逐时参数及各方向辐射强度的太阳能数据进行了验证。

期刊

主成分分析法太阳能电池板

主题模型在统计机器翻译中的应用

与本文相关的学术论文