主题模型在统计机器翻译中的应用

来源 :中国科技信息 | 被引量 : 0次 | 上传用户:wh13499599
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在基于短语的统计机器翻译中,短语表是解码器工作的核心部分,它主要包含了源端和目标端短语的翻译概率和词汇互译概率;但传统的短语表数量庞大,并且领域自适应能力差。为了在解码过程中挑选出更高质量的短语对.适当减少内存消耗和缩小解码空间,本文介绍了一个简单易行的基于主题模型的统计机器翻译系统的实现:首先使用LDA工具建立主题模型,然后把主题模型信息嵌入到短语表中,最后为解码器设计一个预处理模块可以使解码器不需要改变就可以在翻译过程中根据主题选择合适的短语对,从而提高了翻译的效率和质量。
其他文献
介绍了烟气排放连续监测系统的使用现状;依据雷电学原理及相关防雷技术规范,分析了烟气排放连续监测系统遭雷击的原因及其防雷方面存在的问题;综合运用隔离、屏蔽、合理布线、等
目的:构建能在真核细胞内稳定表达小鼠白介素-12(mIL-12)的质枉,为进一步研究mIL-12的免疫调节机制及其抗肿瘤作用奠定基础。方法:通过聚合酶链反应(PCR)扩增质枉pORF-mIL012(Elasti),
在zigbee定位技术中,各种因素的影响会导致定位不精确。经实验表明,参考节点的布局位置会影响定位精度。因此,就针对参考节点布局位置,提出参考节点的布局方案,采用正方形、圆形、等边三角形的方式,分别对盲节点的坐标进行测量、分析,从而选取最优的布局方案,提高定位的精度。
目的:观察乏氧放射增敏剂甘氨双唑钠(CM)的应用能否提高肝动脉栓塞(TAE)结合外放射治疗肝肿瘤的效果.方法:采用大鼠肝内移植Walker256肿瘤模型,以肝动脉结扎(HAL)的方法阻断
随着Internet的迅猛发展及教育网络基础建设的全面实施,高校信息化、网络化为高职院校的建设和发展创造了新的契机。通过具体实例,对在原有基础上扩建改造校园网的设计思路和实
目的:观察植物血凝素PHA对细胞因子诱导的杀伤细胞(cytokine-induced killer cells, CIK)体外扩增的影响.方法:在外周血单个核细胞定向诱导CIK细胞时加或不加PHA,观察细胞增
本文以湖南涉外经济学院为研究对象,介绍了开放性实验室建设的必要性、开放措施以及在创新人才培养方面取得的成绩。对构建良好的实验室开放环境,提高学生的实践能力和创新能力
国内首本关于微信公众平台二次开发的著作.系统讲解了微信公众平台的各项高级功能的使用,以及二次开发的完整流程和方法:面向完全没有开发经验的读者.以实用为导向,旨在通过大量案
目的:探讨肝细胞癌(hepatocellular carcinoma,HCC)endoglin (CD105)、血管内皮生长因子(vascular endothelial growth factor, VEGF)和有丝分裂抑制因子(p57kip2)的表达与组
利用主成分分析法,分析太阳能小屋周围的光照强度之间的强弱影响,鉴于此基础来安装太阳能电池板,并用山西大同典型气象年逐时参数及各方向辐射强度的太阳能数据进行了验证。