论文部分内容阅读
【摘要】该文描述了三种脱机手写体文字识别中的细化方法-轮廓跟踪细化算法、灰度脊算法和快速小形变细化算法。通过对不同细化算法的描述,分析出各个细化算法所应用的不同场合,从而可以更高效的识别脱机手写体文字。
【关键词】细化;边缘侵蚀;灰度脊;快速小形变
脱机手写体识别是模式识别中的一个重要领域,同时也是模式识别领域中的难题之一。文字的机器自动识别是是智能计算机接口的一个主要的部分,也是文字高速、自动输入计算机的重要手段,它在办公自动化、邮政、银行票据处理、表格录入、机器翻译等的方面有广阔的应用前景。它涉及人工智能、图像识别、计算机科学、心理学、语言学等领域。脱机手写体文字识别的第一个阶段就是图像的预处理,而预处理中需解决的一个重要的问题就是图像的细化。
一、脱机手写体文字识别的预处理
一般来说,脱机手写体文字识别预处理的流程主要包括文字的区域定位和分割、图像的灰度化、二值化、图像的平滑和去噪以及归一化、细化。细化是预处理的最后一步。如图1所示。
二、脱机手写体文字识别细化算法
对于给定的字符图像使笔划宽度变细,从而提取线宽为一的中心线的操作叫细化。细线化主要用来分析字符的结构特征,便于后面文字图像特征的提取。
文字细化的基本要求如下:
(1)要保持原有笔划的连续性,不能由于细化造成笔划断开。
(2)要细化为单线,即笔划宽度只有一个像素。
(3)细化后的骨架应尽量是原来笔划的中心线。
(4)要保持文字原有特征,既不要增加,也不要丢失。
(一)边缘跟踪细化算法
轮廓跟踪细化算法的实质是边缘侵蚀细化算法。它是在二值化图像的基础上进行的一种细化。文字图像的边缘就是与背景点相邻的前景点,由于背景点用0表示,前景点用1表示,所以二值化图像中的边缘点就是与0相邻的1点。
跟踪的一个基本思想是以前面一个边缘点的方向信息作指导,立足于当前边缘点,搜索前进,直至找出一条完整轮廓曲线或跟踪结束。每接收一个边缘点,便赋予其追踪标志,以便接下来能够正确地搜索。
跟踪准则是:按照从左到右,从上到下的顺序搜索轮廓信息矩阵,直至遇到第一个大于0 的值,该点就是区域的边界点,记录该点坐标作为下一轮继续跟踪的起点 P。从起点 P 开始,用八连通域法跟踪区域的轮廓。初始方向设定为向右。若起始方向所指的点值大于 0,即为下一个边界点Q;否则每次顺时针旋转 45°检测邻点,直至找到其值大于 0 的点,把此点作为新的边界点Q,在当前搜索方向的基础上逆时针旋转 90°,继续用同样的方法搜索下一个边界点R,直到返回最初的边界点P 或找不到其值大于 0 的点为止。[1]
(二)灰度脊算法
灰度脊算法是在灰度图像的基础上提取局部最大灰度的脉络,由于文字笔画中间和边缘部分的灰度不同,所以提取的"山脊"有可能是"主脊"也有可能是"副脊",还有一部分的噪声也会被提取出来,这就需要分析比较,通过边缘跟踪法逐层向内搜索,直到最后剩余单像素,即为选择出的"主脊"。[3]
此方法的难点及重点就在于"脊梁"的提取与"主脊"的分析。此方法比较适用于被水渍浸泡过的字迹或表面污损很严重的字迹的识别。
(三)快速小形变细化算法
快速小形变细化算法也是在二值化图像上进行的。首先定义一些相关的概念:
点段:一行中值为 1的连续像素序列称为点段。
相关点段:如果相邻二行的两个点段满足下列条件之一则为相关点段。
下一行某个点段的左端点在上一行某个点段的左右端点之间。
下一行某个点段的右端点在上一行某个点段的左右端点之间。
此行某个点段的左端点在下一行某个点段的左右端点之间。
此行某个点段的右端点在下一行某个点段的左右端点之间。
一对多相关:一个点段与多个点段相关。
相关段:在一个点段集当中,如果任一点段都和它的下一行的一个点段一对一相关且每个点段长度都小于一定阈值, 则称这些点段集为相关段。
细化过程为:文字图像进行二值化之后,开始进行从上到下,从左到右的扫描,就会得到不同的点段。根据前面的叙述分别找到并标记出各个点段。要去除毛刺就需要把文字笔画末端的修饰去除掉。为了去除图像的伪分支这里保留相关段包含的所有点段中点的像素作为最后的骨架。在每一个同组要点段的两端点之间直接连一条线,直线经过的像素作为需要保留的像素。[2]
三、总结
由以上的描述可知,三种细化算法各有利弊,可用于不同的识别场合。
轮廓跟踪细化算法是最普遍、最简单的细化算法。它适应的范围比较广,但是边缘点很少能够成图像分割所要求的闭合、连接的边界,对不连通区域、符合区域的跟踪细化效果不是很好。另外该算法要进行多次去边缘操作,运算量大,速度慢,还会引出毛刺和伪分支。
灰度脊细化算法可大大降低毛刺、伪分支的出现。但应用范围比较窄,只适用于被浸污的文字的识别。如果文字图像中没有出现大量的污渍,那么算法就会提取出大量的"主脊",使得"主脊"与"副脊"分辨不清,从而不能达到细化的目的。
【参考文献】
[1]孙艳英,杨克俭.一种基于预处理的边界检测算法.武汉理工大学学报,2004(1).
[2]龚才春,刘荣兴.面向字符识别的快速小形变细化算法.计算机应用与软件,2005(2).
[3]龚才春,刘荣兴.强干扰复杂背景下文字识别算法的研究.华南理工大学学士学位论文.
作者简介:王玉娜,天津师范大学,计算机与信息工程学院计算机科学,研究生责任编辑:王轶萌
【关键词】细化;边缘侵蚀;灰度脊;快速小形变
脱机手写体识别是模式识别中的一个重要领域,同时也是模式识别领域中的难题之一。文字的机器自动识别是是智能计算机接口的一个主要的部分,也是文字高速、自动输入计算机的重要手段,它在办公自动化、邮政、银行票据处理、表格录入、机器翻译等的方面有广阔的应用前景。它涉及人工智能、图像识别、计算机科学、心理学、语言学等领域。脱机手写体文字识别的第一个阶段就是图像的预处理,而预处理中需解决的一个重要的问题就是图像的细化。
一、脱机手写体文字识别的预处理
一般来说,脱机手写体文字识别预处理的流程主要包括文字的区域定位和分割、图像的灰度化、二值化、图像的平滑和去噪以及归一化、细化。细化是预处理的最后一步。如图1所示。
二、脱机手写体文字识别细化算法
对于给定的字符图像使笔划宽度变细,从而提取线宽为一的中心线的操作叫细化。细线化主要用来分析字符的结构特征,便于后面文字图像特征的提取。
文字细化的基本要求如下:
(1)要保持原有笔划的连续性,不能由于细化造成笔划断开。
(2)要细化为单线,即笔划宽度只有一个像素。
(3)细化后的骨架应尽量是原来笔划的中心线。
(4)要保持文字原有特征,既不要增加,也不要丢失。
(一)边缘跟踪细化算法
轮廓跟踪细化算法的实质是边缘侵蚀细化算法。它是在二值化图像的基础上进行的一种细化。文字图像的边缘就是与背景点相邻的前景点,由于背景点用0表示,前景点用1表示,所以二值化图像中的边缘点就是与0相邻的1点。
跟踪的一个基本思想是以前面一个边缘点的方向信息作指导,立足于当前边缘点,搜索前进,直至找出一条完整轮廓曲线或跟踪结束。每接收一个边缘点,便赋予其追踪标志,以便接下来能够正确地搜索。
跟踪准则是:按照从左到右,从上到下的顺序搜索轮廓信息矩阵,直至遇到第一个大于0 的值,该点就是区域的边界点,记录该点坐标作为下一轮继续跟踪的起点 P。从起点 P 开始,用八连通域法跟踪区域的轮廓。初始方向设定为向右。若起始方向所指的点值大于 0,即为下一个边界点Q;否则每次顺时针旋转 45°检测邻点,直至找到其值大于 0 的点,把此点作为新的边界点Q,在当前搜索方向的基础上逆时针旋转 90°,继续用同样的方法搜索下一个边界点R,直到返回最初的边界点P 或找不到其值大于 0 的点为止。[1]
(二)灰度脊算法
灰度脊算法是在灰度图像的基础上提取局部最大灰度的脉络,由于文字笔画中间和边缘部分的灰度不同,所以提取的"山脊"有可能是"主脊"也有可能是"副脊",还有一部分的噪声也会被提取出来,这就需要分析比较,通过边缘跟踪法逐层向内搜索,直到最后剩余单像素,即为选择出的"主脊"。[3]
此方法的难点及重点就在于"脊梁"的提取与"主脊"的分析。此方法比较适用于被水渍浸泡过的字迹或表面污损很严重的字迹的识别。
(三)快速小形变细化算法
快速小形变细化算法也是在二值化图像上进行的。首先定义一些相关的概念:
点段:一行中值为 1的连续像素序列称为点段。
相关点段:如果相邻二行的两个点段满足下列条件之一则为相关点段。
下一行某个点段的左端点在上一行某个点段的左右端点之间。
下一行某个点段的右端点在上一行某个点段的左右端点之间。
此行某个点段的左端点在下一行某个点段的左右端点之间。
此行某个点段的右端点在下一行某个点段的左右端点之间。
一对多相关:一个点段与多个点段相关。
相关段:在一个点段集当中,如果任一点段都和它的下一行的一个点段一对一相关且每个点段长度都小于一定阈值, 则称这些点段集为相关段。
细化过程为:文字图像进行二值化之后,开始进行从上到下,从左到右的扫描,就会得到不同的点段。根据前面的叙述分别找到并标记出各个点段。要去除毛刺就需要把文字笔画末端的修饰去除掉。为了去除图像的伪分支这里保留相关段包含的所有点段中点的像素作为最后的骨架。在每一个同组要点段的两端点之间直接连一条线,直线经过的像素作为需要保留的像素。[2]
三、总结
由以上的描述可知,三种细化算法各有利弊,可用于不同的识别场合。
轮廓跟踪细化算法是最普遍、最简单的细化算法。它适应的范围比较广,但是边缘点很少能够成图像分割所要求的闭合、连接的边界,对不连通区域、符合区域的跟踪细化效果不是很好。另外该算法要进行多次去边缘操作,运算量大,速度慢,还会引出毛刺和伪分支。
灰度脊细化算法可大大降低毛刺、伪分支的出现。但应用范围比较窄,只适用于被浸污的文字的识别。如果文字图像中没有出现大量的污渍,那么算法就会提取出大量的"主脊",使得"主脊"与"副脊"分辨不清,从而不能达到细化的目的。
【参考文献】
[1]孙艳英,杨克俭.一种基于预处理的边界检测算法.武汉理工大学学报,2004(1).
[2]龚才春,刘荣兴.面向字符识别的快速小形变细化算法.计算机应用与软件,2005(2).
[3]龚才春,刘荣兴.强干扰复杂背景下文字识别算法的研究.华南理工大学学士学位论文.
作者简介:王玉娜,天津师范大学,计算机与信息工程学院计算机科学,研究生责任编辑:王轶萌