基于HMM的汉语文本识别后处理琛

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：wzgncsyj1

【摘要】

：

本文用ＨＭＭ描述汉语文本识别后处理，将汉语语言和单字识别这两个概率模型结合起来，以充分利用单字识别器提供的信息。语言模型的参数由语料库统计得到：单字识别模型的参数为条件概率

【作者】

：

李元祥丁晓青

【机构】

：

清华大学电子工程系

【出处】

：

中文信息学报

【发表日期】

：

1999年4期

【关键词】

：

汉字识别后处理语言模型汉语文本识别 HMM

【基金项目】

：

国家863基金,国家自然科学基金

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文用ＨＭＭ描述汉语文本识别后处理，将汉语语言和单字识别这两个概率模型结合起来，以充分利用单字识别器提供的信息。语言模型的参数由语料库统计得到：单字识别模型的参数为条件概率，经理论分析，它要转化为后难事概率来求解。在分析训练样本集单字识别结果的基础上，提出一种统计方法估计候选字的后验概率。ＨＭＭ在脱机手写体汉语文本识别中的实验表明，后处理性能除取决于语言模型外，还取决于后验概率的精确估计。

其他文献

为企业创造一个灵活的经营机制

实达电脑公司成立五年多了.一个人员很少,资金甚微的小公司,每年却以税利翻两番的速度增长,到1993年产、销总额都近4亿元,人均创税利20万元,公司被评为福州市先进标兵企业,成

期刊

电脑公司经济规律办事经营机制计算机终端思想路线解放思想技术优势利润指标负债经营领导机关

手写体汉字在特征空间的可视化分析

手写体汉字特征一般在几百维以上，在这样的高维空间中，汉字样本是如何分布的？本文从可视化的角度对这一问题进行了探讨。论文首先给出了所选用的汉字特征的定义，然后对一些具有代

期刊

汉字识别可视化分析特征空间手写体汉字recognition of Chinese charactersvisualization analysisf

基于未对齐汉英双语库的翻译对抽取

本文主要研究基于未对齐的汉央双语库翻译对抽取。文章首先介绍了ＰａｓｃａｌｅＦｕｎｇ在这方面设计的两个算法。在此基础上，文章对后一种算法进行了部分的改进，使得其更适合于真实双语文本的翻译

期刊

翻译对抽取自然语言处理汉英双语库bilingual corporaalignmenttranslation pairextroutionNLP

广东省伤寒沙门菌株的脉冲场凝胶电泳分型研究

目的运用脉冲场凝肢（PFGE）电泳研究广东省伤寒沙门菌的分子流行病学。方法用PFGE对菌株进行分子分型，所得结果用BionumefiscV4．0软件进行聚类分析。结果来自广东省6个地区的51

期刊

脉冲场凝胶电泳(PFGE)伤寒沙门菌分子分型Pulsed- field gel electrophoresis （PFGE） Salmonella t

空调系统可靠性设计中的几个问题

作者介绍了空调系统可靠性概念,系统可靠性的改进以及机械零件的可靠性,并提出了自己的一些看法。

期刊

空调系统可靠性设计Air conditioner System Realiability Design

棉仁饼酿制酱油的试验报告

传统酱油都是选用优质大豆做原料,以后几经变革,逐步改用豆饼、豆粕而代之。随着生产的发展,酱油原料供应已发生了变化,大部分地区由国家平价供应转变为市场调节。据调查,全

期刊

制曲氨基态氮游离棉酚二油蛋白酶活力销售价格盐水浓度试验报告去毒米曲霉

文本数字水印

目前数字水印技术的研究和文献主要集中在静止图像和视频的保护等方面,文本数字水印研究的很少,国内甚至还未见到文本数字水印的相关文献.而实际上,一些文本文档比图像、视频

期刊

文本数字水印版权保护嵌入方法检测方法文本保护行移编码watermarkingcopyright protection

老师，请您不要说歧视学生的话

作为一农村小学教师，任教30年来，我担任过复式班教师，多个单级班教师。随着国家重视教育程度的提高，我们学校的建设发展和现代化水平越来越高，我们现在可以有专任的教师了。在教学方式上，我们农村小学经历过私塾式的教育，还有“填鸭式”的灌输教育，而现在就大有不同了。随着办学条件的极大改善，教学理念的更新，现在我们的教学方法方式以学生为主体，以教师为主导，师生互动，特别是在育人方面，德育为首、德育为先，更注

期刊

农村小学教师老师学生歧视教育程度教学方式灌输教育复式班

深圳市公务员华支睾吸虫感染情况调查

目的调查深圳市公务员华支睾吸虫感染情况。方法采用系统抽样方法抽取1918份公务员血清样本,以酶联免疫吸附试验（ELISA）检测其华支睾吸虫IgG抗体。结果共调查1918人,血清华支睾

期刊

公务员华支睾吸虫感染率深圳Functionaries Clonorchis sinensis Infection rate

UL认证漫谈(四)

阐述了 UL认证对工厂及产品的跟踪服务制度,介绍了 UL跟踪服务的类别。

期刊

UL认证跟踪服务类别UL certificate Follow -up Service Classification

基于HMM的汉语文本识别后处理琛

与本文相关的学术论文