运用改进的分词方法进行外国译名识别的研究

来源 :计算机仿真 | 被引量 : 9次 | 上传用户:wingkong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文首先介绍了基于词典的分词算法的语言模型和一种基于词典分词算法:最大词频分词法。分析了基于词典的分词算法的语言模型,指出其无法处理未登录词的原因。针对此原因,提出了引入动态词典的方法,将最大词频分词算法和局部频率法相结合以解决未登录词中译名识别的问题。最后,给出了一个系统实现。
其他文献
丙烯酸是一种重要的化工中间体和聚合物单体,需求量巨大。我国丰富的煤炭资源和可再生生物质资源为煤基和生物质基丙烯酸合成路线提供坚实的物质保障。本文将综述这两条主要
油谷树为多年生灌木,株高2米左右,亩产超1吨,经济效益高,是集食用、药用、加工、观赏于一体的神奇植物。其特征特性如下:1、巨粒高产油谷树种植第2年开始抽穗结籽,10月中下旬
新冠肺炎疫情被世界卫生组织(World Health Organization,WHO)定为国际关注的突发公共卫生事件(public health emergency of international concern,PHEIC),并受到全球的广泛
“基层渔业技术推广工作者的工作是很繁杂的,既要推广渔业技术、养殖模式,也要兼顾疫病防控。”肇庆市高要区水产技术推广中心工程师何济升是渔技推广的多面手,一手把现代渔
刑辩律师对于被告人或犯罪嫌疑人合法利益的保护具有重要意义,也是我国司法公正制度的体现,然而由于我国诉讼结构的偏颇,防止 法官审前预判的机制以及社会民众的普遍偏见,刑
近年来,通过乙酸(酯)和甲醛缩合制备丙烯酸的新路线吸引了学术界和工业界的广泛关注。此新路线的优点是过程简单,原料可从天然气、煤化工产品中获得,成本低廉,对可持续生产丙
氯乙烯(VCM)是应用于高分子化工的重要单体,可以通过乙烯法及乙炔法制得。乙烯氧氯化生产VCM过程中二氯乙烷(EDC)的裂解生成VCM通常需要高温,能耗问题亟待改善。乙炔氢氯化法
群文阅读教学是教师在阅读教学中不断发展创新的一种具有突破性的阅读教学实践。随着教学实践的相继展开,对群文阅读教学的研究也更加深入,教师逐渐对群文阅读教学有了全新的
Turbo码是一种新型差错控制编码,1993年由C.Berrou等人提出。该文在对其原理分析的基础上,介绍了它的几种解码算法。在比较了几种算法的优缺点后,该文对Max-Log-Map这种算法作了改进,乘上一个比例因子,使其性能得到优化。为了能够符合工程上的应用,文章在计算机上使用matlab进行定点仿真,从得出的仿真结果可以看到经过改进的算法,甚至获得了比Log-Map算法更多的编码增益,因此改进
2008年10月22日下午,第12届生物医药产业发展论坛开幕式在京隆重举行。