脱机手写体文字识别中细化算法的研究

来源 :学问 | 被引量 : 0次 | 上传用户:caoerduo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】该文描述了三种脱机手写体文字识别中的细化方法-轮廓跟踪细化算法、灰度脊算法和快速小形变细化算法。通过对不同细化算法的描述,分析出各个细化算法所应用的不同场合,从而可以更高效的识别脱机手写体文字。
  【关键词】细化;边缘侵蚀;灰度脊;快速小形变
  
  脱机手写体识别是模式识别中的一个重要领域,同时也是模式识别领域中的难题之一。文字的机器自动识别是是智能计算机接口的一个主要的部分,也是文字高速、自动输入计算机的重要手段,它在办公自动化、邮政、银行票据处理、表格录入、机器翻译等的方面有广阔的应用前景。它涉及人工智能、图像识别、计算机科学、心理学、语言学等领域。脱机手写体文字识别的第一个阶段就是图像的预处理,而预处理中需解决的一个重要的问题就是图像的细化。
  


  一、脱机手写体文字识别的预处理
  一般来说,脱机手写体文字识别预处理的流程主要包括文字的区域定位和分割、图像的灰度化、二值化、图像的平滑和去噪以及归一化、细化。细化是预处理的最后一步。如图1所示。
  二、脱机手写体文字识别细化算法
  对于给定的字符图像使笔划宽度变细,从而提取线宽为一的中心线的操作叫细化。细线化主要用来分析字符的结构特征,便于后面文字图像特征的提取。
  文字细化的基本要求如下:
  (1)要保持原有笔划的连续性,不能由于细化造成笔划断开。
  (2)要细化为单线,即笔划宽度只有一个像素。
  (3)细化后的骨架应尽量是原来笔划的中心线。
  (4)要保持文字原有特征,既不要增加,也不要丢失。
  (一)边缘跟踪细化算法
  轮廓跟踪细化算法的实质是边缘侵蚀细化算法。它是在二值化图像的基础上进行的一种细化。文字图像的边缘就是与背景点相邻的前景点,由于背景点用0表示,前景点用1表示,所以二值化图像中的边缘点就是与0相邻的1点。
  跟踪的一个基本思想是以前面一个边缘点的方向信息作指导,立足于当前边缘点,搜索前进,直至找出一条完整轮廓曲线或跟踪结束。每接收一个边缘点,便赋予其追踪标志,以便接下来能够正确地搜索。
  跟踪准则是:按照从左到右,从上到下的顺序搜索轮廓信息矩阵,直至遇到第一个大于0 的值,该点就是区域的边界点,记录该点坐标作为下一轮继续跟踪的起点 P。从起点 P 开始,用八连通域法跟踪区域的轮廓。初始方向设定为向右。若起始方向所指的点值大于 0,即为下一个边界点Q;否则每次顺时针旋转 45°检测邻点,直至找到其值大于 0 的点,把此点作为新的边界点Q,在当前搜索方向的基础上逆时针旋转 90°,继续用同样的方法搜索下一个边界点R,直到返回最初的边界点P 或找不到其值大于 0 的点为止。[1]
  


  (二)灰度脊算法
  灰度脊算法是在灰度图像的基础上提取局部最大灰度的脉络,由于文字笔画中间和边缘部分的灰度不同,所以提取的"山脊"有可能是"主脊"也有可能是"副脊",还有一部分的噪声也会被提取出来,这就需要分析比较,通过边缘跟踪法逐层向内搜索,直到最后剩余单像素,即为选择出的"主脊"。[3]
  此方法的难点及重点就在于"脊梁"的提取与"主脊"的分析。此方法比较适用于被水渍浸泡过的字迹或表面污损很严重的字迹的识别。
  (三)快速小形变细化算法
  快速小形变细化算法也是在二值化图像上进行的。首先定义一些相关的概念:
  点段:一行中值为 1的连续像素序列称为点段。
  相关点段:如果相邻二行的两个点段满足下列条件之一则为相关点段。
  下一行某个点段的左端点在上一行某个点段的左右端点之间。
  下一行某个点段的右端点在上一行某个点段的左右端点之间。
  此行某个点段的左端点在下一行某个点段的左右端点之间。
  此行某个点段的右端点在下一行某个点段的左右端点之间。
  一对多相关:一个点段与多个点段相关。
  相关段:在一个点段集当中,如果任一点段都和它的下一行的一个点段一对一相关且每个点段长度都小于一定阈值, 则称这些点段集为相关段。
  细化过程为:文字图像进行二值化之后,开始进行从上到下,从左到右的扫描,就会得到不同的点段。根据前面的叙述分别找到并标记出各个点段。要去除毛刺就需要把文字笔画末端的修饰去除掉。为了去除图像的伪分支这里保留相关段包含的所有点段中点的像素作为最后的骨架。在每一个同组要点段的两端点之间直接连一条线,直线经过的像素作为需要保留的像素。[2]
  三、总结
  由以上的描述可知,三种细化算法各有利弊,可用于不同的识别场合。
  轮廓跟踪细化算法是最普遍、最简单的细化算法。它适应的范围比较广,但是边缘点很少能够成图像分割所要求的闭合、连接的边界,对不连通区域、符合区域的跟踪细化效果不是很好。另外该算法要进行多次去边缘操作,运算量大,速度慢,还会引出毛刺和伪分支。
  灰度脊细化算法可大大降低毛刺、伪分支的出现。但应用范围比较窄,只适用于被浸污的文字的识别。如果文字图像中没有出现大量的污渍,那么算法就会提取出大量的"主脊",使得"主脊"与"副脊"分辨不清,从而不能达到细化的目的。
  
  【参考文献】
  [1]孙艳英,杨克俭.一种基于预处理的边界检测算法.武汉理工大学学报,2004(1).
  [2]龚才春,刘荣兴.面向字符识别的快速小形变细化算法.计算机应用与软件,2005(2).
  [3]龚才春,刘荣兴.强干扰复杂背景下文字识别算法的研究.华南理工大学学士学位论文.
  作者简介:王玉娜,天津师范大学,计算机与信息工程学院计算机科学,研究生责任编辑:王轶萌
其他文献
【摘要】社保基金是劳动人民的“保命钱”,而产业投资基金是现在社会激烈争论的焦点,这两者之间有着千丝万缕的联系,社会基金能否作为产业投资基金的投资人不仅关系到社会整体的利益,更是关系到国家的稳定和可持续发展。至此,笔者认为基于长远的眼光,社保基金必然能够作为产业投资基金的投资者,但是,我们要从政府、基金管理者、企业自身等各方面加强监管,促进产业投资基金的发展。  【关键词】社保基金;政府监管;产业投
期刊
【摘要】加快中小企业发展对我国经济发展具有重要意义。在中国有其不可忽略的重要层面,解决好班子建设、科学运营和社会大力扶持是中小企业发展的重要因素。   【关键词】 中小企业;发展;因素分析    中小企业在各国国民经济中均具有重要地位。据统计资料显示,中小企业数量一般占95%以上,就业人数占60%左右,而提供的产值约占50%左右。根据国家经贸委提供的资料表明,截止1999年上半年,全国工商登记的中
期刊
【摘要】商标权共有,是指两个或两个以上的民事主体就同一商标共同享有注册商标专用权的制度。本文试图通过对事实意义上的商标权的阐述,分析商标权共有现象产生的客观性,探讨确立商标权共有的理论依据,揭示对于解决商标权利冲突的重要意义。  【关键词】商标法;商标权;商标权共有    商标权共有,是指两个或两个以上的民事主体就同一商标共同享有注册商标专用权的制度。《中华人民共和国商标法》(以下简称《商标法》)
期刊
【摘要】利用存储在计算机中的有线电视网络图纸资料,再引入全球卫星定位系统,与手提电脑、掌上电脑或智能手机配合,通过OZI地图软件实现卫星定位查询线路故障功能。  【关键词】全球卫星定位系统;地图;网络维护    1GPS系统简介  美国从20世纪70年代开始研制GPS全球卫星定位系统,于1994年全面建成。GPS是具有在海、陆、空进行全方位实时三维导航与定位能力的新一代卫星导航与定位系统。  (1
期刊
【摘要】沥青路面结构不仅要满足行车荷载的要求,还要适应所处的自然环境。本文针对沥青路面的机构系统与环境之间的相互关系进行了比较深入的研究,同时对沥青路面适应环境的途径进行了总结。  【关键词】沥青路面;结构系统;环境分析    由于我国地域辽阔,各地环境差异性大,沥青路面存在开裂的普遍性、损坏后无法愈合且难以修补等一些缺陷,因此积极开展沥青路面合理结构组合形式研究,对防治路面的早期破损、提高路面耐
期刊
【摘要】本文在企业智力资本和员工培训的理论基础上指出了智力资本提升与员工培训的内在联系,并建议构建基于智力资本提升的员工培训体系来提高企业的竞争力。  【关键词】企业智力资本提升;员工培训;内在联系    一、绪论  由美国次贷危机引发的国际金融危机,给世界经济带来了强烈冲击和影响,也给许多企业带来了严峻挑战和巨大压力。面对危机下有些企业开始采取缩减招聘计划或裁员等降低人力成本以摆脱困境的现象,很
期刊
【摘要】本文结合工作实际,从工程质量管理、工程设计及建筑新材料在工程中的应用方面探讨了工程质量问题及预防措施。  【关键词】房屋建筑;工程质量;问题预防    随着社会的发展和科学技术的进步,新的设计理念、结构体系、建筑材料及施工机具设备的不断出现,施工工艺、施工技术的不断改进,房屋建筑工程质量不断上升,人居环境质量得到了极大的提高。但在建筑工程中,质量问题时有发生,本文结合工作实际,从工程质量管
期刊
【摘要】本文详细介绍了一种中频接收机芯片SC801的原理及应用。SC801是一种高性能的镜像混频器,具有镜像抑制高、噪声低等特点。将其应用于雷达接收机中作为二混频放大电路,并对应用中出现的问题加以分析解决,使该电路更具实用性和可靠性。  【关键词】中频接收芯片;SC801;镜像抑制;二混频放大电路     1.引言  SC801雷达中频接收机芯片是24所研制出的一种高性能的镜像抑制混频器,采用0.
期刊
【摘要】随着数字技术和信息网络的发展,数字化背景下,我国电视内容产业价值链逐渐开始了拓展、重构和迁移。本文运用价值链分析法,对电视内容产业价值链的构建及战略环节(利润区)进行分析,提出了电视内容产业价值链的迁移及其对策。  【关键词】数字技术;电视内容产业;价值链;迁移     一、理论与方法概述    (一)波特价值链理论阐述  哈佛大学商学院教授迈克尔·波特于1985年提出了价值链理论。在波特
期刊
【摘要】本文说明在山区建设计高速公路桥梁,遇到的问题及采用的解决办法。  【关键词】山区;高速公路;桥梁;设计     随着我国经济建设的发展,特别是西部大开发战略的实施,我国在山区修建的高速公路越来越多,山区高速公路地形地质复杂,构造物多,桥梁隧道总长占路线长度的比例大,有的山区高速公路,桥隧比例高达70%—80%。所以要设计成功一条山区高速公路,设计好其中的桥梁部分就显得十分重要。   一、山
期刊