【摘 要】
:
汉字识别是一种典型的大规模式识别问题.解决多类模式识别问题的一种方法就是把它分解成一组更简单的类数更少的识别问题的组合.本文研究了这样一种方法,把多类问题分解成最简单的两类问题的组合,提出了"否定概率和"合成方法.并把这种方法应用到汉字识别中,将首选识别率从89.25﹪提高到97.17﹪,幅度达7.92个百分点,错误率降低73.67﹪,取得了较好的效果.
【机 构】
:
清华大学计算机科学与技术系智能技术与系统国家重点实验室(北京)
论文部分内容阅读
汉字识别是一种典型的大规模式识别问题.解决多类模式识别问题的一种方法就是把它分解成一组更简单的类数更少的识别问题的组合.本文研究了这样一种方法,把多类问题分解成最简单的两类问题的组合,提出了"否定概率和"合成方法.并把这种方法应用到汉字识别中,将首选识别率从89.25﹪提高到97.17﹪,幅度达7.92个百分点,错误率降低73.67﹪,取得了较好的效果.
其他文献
本文简要总结了设计硅铁电炉电气参数和几何参数确定的基本方法.这种方法选择参数的结果符合硅铁冶炼热化学反应的特征要求,在实践中认为是有效的实用技术.
本文主要介绍了炭电极的发展速度,炭电极的适用范围,工业硅电炉发展趋向,炭电极的创新和发展,以及炭电极的售后服务等方面内容.
电极硬断造成生产损失.本文主要通过从停炉工艺、原材料工艺、电极糊工艺和送电工艺角度出发、制定合理方案,维护好电极,降低生产损失.
本文提出抽取填入表格信息的消去表格线的最优屏蔽算法,它是对[1]中的基本最优屏蔽算法的改进.该算法首先根据登录的空白表格的参数计算填入信息的表格图像的表格线部分,并将其除去,余下部分再用[1]中的基本最优屏蔽方案除去.最后,进行实验研究.实验结果表明,提出的算法有明显的改进,是一个更有效的算法.
本文主要介绍了硅铁电炉的主要参数、电极的正确压放,电极的合理维护、电极事故的处理等方面内容.力图减少电极事故的发生,保证生产正常进行.
信封图像的倾斜矫正是信函自动分拣研究中的一个重要问题.倾斜矫正的好坏将直接影响地址单字分割和字符识别,进而影响整个分拣系统的效果.通常情况下,Hough变换可以较好解决倾角检测问题.但对信封图像而言,Hough变换计算量大,速度慢,不能满足快速分拣要求.为克服这一缺点,本文在Hough变换的基础上,结合信封图像的几何规划,提出了适合信封图像的倾斜矫正算法:区域Hough变换.首先通过连通域分析与合
把不同字体文本看作不同的纹理,使用Gabor滤波器提取纹理特征,通过识别纹理来识别字体是一种简便有效的方法.但是,现有的字体纹理识别方法没有考虑字体纹理本身的特点,因此本文对原有方法在两方面加以改进以提高字体识别率:通过使用遗传算法优化滤波器角度参数来优化滤波器设计,使其更能适应字体纹理的特点,提取有效特征;设置多个字典以消除印刷质量不均及笔划密度分布对字体纹理造成的影响.最后对报纸正文四种基本字
本文提出了一种分级的电路板图像中的文本定位方法.该方法分三步:基于梯度图像空间方差文本定位;基于纹理的文本定位以及基于颜色聚类的文本定位.通过对我们图像样本库中电路板图像的试验,验证了本文方法的速度和效果.
本文提出了一套基于统计的中文标点识别算法,包括特征抽取、特征选择及贝叶斯分类器的应用.与现有的基于逻辑判断的算法相比,本算法有较强鲁棒性、易于扩展功能,具有普遍意义,并且实验结果表明该方法识别率比逻辑判断算法有所提高.
本文以银行票据OCR系统中的账号为例,分析了手写数字串切分的难点,提出一种基于多种切分方法组合的手写数字串切分方法,将BFA、LDP、滴水三种切分算法组合起来,用于手写数字串的切分,以提高手写数字串的切分正确率,并对组合的策略及决策函数进行了研究.