基于HMM的联机汉字识别系统及其改进的训练方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:weishuange0l
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文描述了一个基于HMM模型的联机汉字识别系统的设计思想与实现方法.系统以联机汉字的笔段序列作为观察序列,采用带有多跨越的模型结构消除自由书写汉字笔段序列的冗余与丢失问题.HMM模型的训练是本系统设计的一个重要问题,针对复杂HMM模型参数训练容易收敛于局部最小的情况,本文结合联机汉字识别的特点,提出了一种利用"引导模型”进行训练的改进方法,避免了训练过程收敛于局部最小点的发生.经过大量样本的训练,本系统对规范书写汉字和自由书写汉字均取得了比较令人满意的结果.
其他文献
研究肝癌的血管生成与转移的关系,对控制肿瘤的生物学行为至关重要。本文简要综述了血管内皮生长因子(VEGF)和血管内皮生长因子受体(VEGFR)的研究进展,重点综述了VEGF和VEGFR与肝癌
目前汉字编码设计和处理大都依赖人工作业,不仅效率低,而且性能差。文章指出:汉字编码技术的一项基本改革是系统内部信息结构的改革,以实现电脑对汉字特征信息的程控操作。描述了
<正> 液体葡萄糖亦称淀粉糖浆、葡萄糖浆或糖稀,它是淀粉糖三大类(葡萄糖、淀粉糖浆和果葡糖浆)之一。淀粉糖在许多国家的生产和应用都发展很快。美国是淀粉糖工业发展最快、
梅毒是一种危害严重的性传染病,对梅毒进行准确的检测,可临床确诊梅毒以及防止梅毒的传播。根据梅毒螺旋体的生物学特性及病情的分期,梅毒螺旋体的实验室检测主要包括:病原体、非
据美国VLSI市场研究公司宣布,1992年美国半导体销售额占世界半导体市场43.8%,日本仅占43.1%,这是1986年以来美国首次超过日本,重新登上世界半导体市场的宝座.1993年日美半导
<正> 粑油名称的由来是因系粑曲(甜面酱的坯子又称甜面糕黄子)酿制而得名,是武汉地区民间流传生产甜昧酱油的一种简易方法。由于制作原料主要以面粉为主,且通过传统的天然稀
杜拉拉,不只要升职还要生活,她在追求美好事业、浪漫爱情的同时,也没有放弃对办公室健康的执着追求,像杜拉拉这般事业健康兼顾的高智商职场美女,才配得起“职场老妖精”的光荣称号
(二) 生产育种生产育种就是利用在大生产中自然发生的变异所进行的菌种选育工作。例如,山东酒精总厂在生产中,原来应用的糖化曲菌种是A.S3.758于佐美曲霉,此菌种孢子为黑色。
<正> 瓶装美味芝麻辣酱是消费者十分喜爱的佐餐佳品。它是以芝麻酱和辣椒酱为主体,再添加甜面酱、鲜酱油以及香辛料而制得。凡品质上等的产品,不但要讲究选料和用料,而且更需
目的分析广西学校2005~2007年呼吸道传染病突发事件流行病学特征,为制订预防控制措施提供科学依据。方法用描述流行病学的方法对2005~2007年广西各类学校呼吸道传染病突发事件