一种基于模糊神经网络的印刷品字符识别器

来源 :教育科学博览 | 被引量 : 0次 | 上传用户:happyyearer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:为了提高印刷品字符识别的效率,本文建立了一种基于模糊神经网络的字符识别模型,该模型对已有标准字符样本进行学习,训练出神经网络的模糊化层、模糊规则层和清晰化层,结合角点定位和连通域分析技术对待识别印刷品进行字符准确提取及识别,本方法识别率为86.53%。
  关键词:模糊神经网络;字符识别;角点;连通域
  0 引言
  印刷体字符识别技术具有极大的实用价值,被广泛应用于大量文报资料、财务票据、文案扫描等文件处理领域[1]。它采用模式识别方法,将通过光学扫描输入得到的印刷品图像,转化为计算机能够处理的电子文档,其技术衡量指标包括识别率、识别速度、版面理解正确率及版面还原满意度四个方面[2]。
  近年来,以模糊逻辑、神经网络与遗传算法为代表的人工智能这一新兴学科以其强大的学习功能在字符识别领域得到了广泛的应用。其中,模糊控制常用于少量字符情况下,它具有不依赖被控对象的精确模型、鲁棒性强、算法简明易懂等特点,但是其规则库难于设计,学习功能差;神经网络可以用于大规模字符识别,它具有能够逼近任意非线性函数关系的能力和比较方便的学习手段等特点[3,4],但其参数不易收敛,推理功能差。而模糊神经网络集两者优势于一体,具有高鲁棒性和高度非线性学习能力,能够准确、快速的对已有数据进行学习,并在一定程度上提高了字符识别效率。本文利用模糊神经网络,采用角点定位和连通域提取等技术,设计了一套印刷体字符识别的新方法。
  1 FNN结构和学习算法
  FNN结构如图1所示,第一层为输入层,该层的各个结点直接于输入图像向量的各分量x1连接,它起着将输入值x=[x1 x2 …xn]T传送到下一层的作用,该层结点数N1=n;第二层每个结点代表一个模糊语言变量值,如PB,NS等。它的作用是计算各输入分量属于各语言变量值模糊集合的隶属度u,本文的隶属度函数采用最常用的高斯函数,该层结点数N2=m1+m2+…mn;第三层的每个结点代表一条模糊规则,它的作用是用来匹配模糊规则的前件,计算出每条的适用度,即ai=min{ ui1,ui1,ui2…uin},对于给定的输入,只有在输入点附近的那些语言变量值才有较大的隶属度值,远离输入点的语言变量值的隶属度很小或者是0,该层结点数为m;第四层用于归一化计算,其结点数与第三层相同;第五层是输出层,实现清晰化计算,其yi=wi1a1+ wi2a2+ … wirar,i=1,2,..r。
  图1
  该网络学习方法与BP反向传播网络训练方法类似,基本步骤为:①初始化网络的随机权值wi;②计算结果与期望输出向量的误差;③按a=0.7的比例学习因数调整第五层神经元的权重,以减少与期望的误差;④将误差返回到上层的每个神经元;⑤重复③④调整每个神经元的权重,直到网络满足要求为止。
  2 字符特征提取
  图2为系统流程图,在图像采集后,需要将图像规则化,这通过滤波、二值化、平移、旋转等操作来实现。图像滤波方法很多,本文采用常用的平滑滤波;而旋转变换则需要判断出图像的角度。一般印刷品具有规则的几何形状,故在标准平面坐标下,根据图像四个角之间相对距离的不变性,经过旋转后的图像必与水平坐标呈某一角度[5] ,故可以检测出图像的四个角作为角点,计算出角点间连线与水平坐标的夹角,进而将待检测图像及标准图像恢复到水平位置,即可做进一步的单个字符提取,按照正确的角度去识别印刷品上的内容。
  角点是二维图像亮度变化剧烈的点或图像边缘曲线上曲率极大值的点,通过对待检测图像求其二次梯度图,可知其每个象素点的灰度变化剧烈程度,进而获得图像四个角的坐标值。然后,通过角点坐标,我们可以计算出图像的倾斜角度,则角度旋转后可将图像转化为与标准模板相同的角度。
  下一步就是提取单个字符并识别,本文采用连通域分析法进行字符提取。
  象素的连通域是一个基本概念,它能够对数字图像区域和边界等概念进行简化。当两个象素相邻并且象素值满足一定的相似性准则,则这两个象素连通,依据具体范围需要,一般分为4邻接连通域,8邻接连通域和m连接连通域。本实验是在已知字符大小的情况下,将规定的、大小合理的提取线框从左、上到右、下进行逐行移动,依据各种标点符号的类型,汉字的上下、左右等构成方式,把规定合理范围内最相近连通域结合,视为一个字符。为了防止产品印刷过程中漏印、飞墨、针孔、刮擦等情况出现,我们又针对不同的连通域使用不同的图像处理方法,比如:为防止漏印,将4连接连通域和8连接连通域结合使用,减少漏印象素的影响;为防止飞墨,将完全连通域取中值,以恢复其合理的结构。
  3 仿真研究
  本文仿真软件使用MatlabR2010b,图像采集设备为工业摄像头。模糊神经网络输入为上述规定方框的象素值,输出为人工设定的字符标号,比如:0表示阿拉伯数字‘0’,55表示汉字‘人’字,80表示英文字母‘B’。
  该系统采用监督学习方法,依据1、2所述原理,第一步为训练阶段,采集标准印刷品图像上面300个常见字符作为训练数据,对所建模糊神经网络进行训练。第二步是学习测试阶段,将作为训练的印刷品作为测试样本,其学习准确率为98%,高于单独使用神经网络(92%);第三步是实际测试阶段,将其他类似印刷品字符作为测试数据,得出的字符识别准确率是86.53%,高于单独使用神经网络(74%)。
  4 结论
  本文利用模糊神经网络,使用角点定位和连通域分析等技术,建立了一个印刷品字符识别器。实验结果表明,相对于单纯学习算法,该模糊神经网络具有很好的学习能力和很强的鲁棒性,能够很好应用于印刷品字符识别领域。未来工作可放在改进学习算法和在字符大小不同情况下的识别两个方面。
  图2
  参考文献
  [1] 李果. 自动印刷质量检测技术及系统综述[J]. 印刷质量与标准化,2011.
  [2] 钟辉. 彩色印刷品图像缺陷自动检测系统算法的研究[D]. 吉林大学,2007
  [3] 赵晓霞. 一种粗糙模糊神经网络识别器及其应用[J]. 中北大学学报(自然科学版),2009
  [4] 周泽华, 胡学友等. 基于神经网络的印刷体数字字符的识别[J]. 自动化与仪器仪表,2009
  [5] 王诗琴, 程耀瑜等. 等基于角点定位的印刷品缺陷监测[J]. 信号与系统, 2011
  作者简介
  赵之光(1988-),男,硕士,主要研究方向为机器图像视觉;
  夏劲松(1982-),男,硕士,主要研究方向为数字图像处理和路径规划。
其他文献
摘 要:本文对某厂转炉一次烟气除尘风机转子在低转速运行模式下生产的安全可靠性进行探讨、同时考虑在此模型下风机运行的可能性。  关键词:转炉一次烟气除尘风机  一、概述  某厂近期转炉一次烟气除尘风机发生叶轮叶片飞出,造成该叶轮损坏、自由端轴承座一个地脚螺栓孔崩裂、下机壳部分击穿被迫停产。因无备用风机转子,因此,只能采取临时措施应急生产。鼓风机厂家仅有一台转子(有潜在缺陷)只能在低速1800r/m
期刊
摘 要:介绍了内蒙古岱海发电有限责任公司600MW机组钛管凝汽器化学清洗情况。针对其结垢特点选择高效复合酸作为清洗剂,将凝汽器及冷油器进行串联清洗,清洗后凝汽器管及冷油器管内的垢被完全清除。机组重新启动后,凝汽器端差明显降低,真空度上升,煤耗降低,机组的效率得到提高,经济效益显著。  关键词:凝汽器;钛管;高效复合酸;化学清洗  钛具有优良的耐腐蚀性能和钛表面氧化膜的浸润性很差、表面光滑不易结
期刊
摘要:文章探讨了管壳式换热器设计过程中管箱、壳体、管束、折流板和防冲板等参数的选择,提出了对设计过程中常见问题的解决方案,可以为此类换热器的设计提供参考。  关键词:管壳式换热器,管箱,壳体,管束,折流板,防冲板,设计  Parameters Determine in Shell-Tube Heat Exchanger Designing  Zhou Hai-ge*, SUN Ai-jun  (C
期刊
摘要:根据烯烃聚合工业用烷基铝易发生火灾爆炸等特征,对烷基铝分类、命名、化学性质、反应特性以及贮存、使用、管理等过程中的危险性进行分析。提出了烷基铝贮存、运输、使用、废弃物处理以及人员防护等方面的风险消减与事故预防措施。  关键词: 烷基铝 特征 危险性分析 风险削减  Analysis of alkyl aluminum risk and mitigation strategies fo
期刊
摘 要:解法一实际上是从不等式角度出发,构造均值不等式求解;解法二是从函数角度出发构造函数,转化为函数最值问题;解法三是从几何特点出发利用数形结合思想进行求解。上述三种解法也是我们在求最值问题时经常用的方法,至于选择何种方法要结合题意。  关键词:三角函数最值、不等式角度、函数角度、几何特点  近日,在高三期中考试全市统考中出现了这样一道题:已知向量■与■共线,其中A是的内角(1)求角A的大小。(
期刊
摘 要:自制了以4,4'-二苯基甲烷二异氰酸酯(MDI)为异氰酸酯组分的聚酯型阴离子水性聚氨酯乳液,并采用共混方法制备了丙烯酸酯改性水性聚氨酯乳液。研究了不同PU/PA共混比例对水性聚氨酯的结构和性能的影响。结果表明不同比例的共混改性的涂膜性能比水性聚氨酯乳液涂膜的耐水性能和耐热性能有明显的提高。  关键词:水性聚氨酯;聚丙烯酸酯;共混;性能  中图分类号:TQ433.432  1 引言  水性
期刊
摘要:在北方地区,燃气供热锅炉得到了广泛的应用。介绍了燃气供热锅炉房节能潜力,分析了影响燃气供热锅炉房节能潜力的因素,并简要阐述了燃气锅炉房节能潜力及效果。  关键词:燃气供热锅炉 节能技术 影响因素  1 燃气供热锅炉房节能潜力  近年来,随着城市能源结构发生的变化,天然气作为供暖燃料在我国正得到大力开发和逐步推广应用,很多城市开始对燃煤、燃油锅炉房实施煤改气工程,节能效果有了较大改善。  以大
期刊
据国外媒体报道,日前,科学家宣称,在印度洋深海区域发现恐龙时代沉没的远古大型陆地。  这两个大陆分段,叫做微大陆块,是印度洋板块、南极洲板块和澳洲板块从冈瓦那古陆分离时形成的残留部分。最新发现的沉没微大陆块面积相当于美国西佛吉尼亚州,之前曾被测绘师认为是巴达维亚海峰,但当时除了获悉所在位置之外,并未掌握其他任何特征,所在区域位于澳大利亚佩斯市以西1600公里海域。  令人吃惊的深海岛屿发现  为了
期刊
摘要:论述了直角尺检查仪的原理、结构和正确使用(操作)方法,以及操作中普遍存在的问题。针对执尺方法不当,而导致的示值不稳定、人为误差大等“难操作”,推荐了笔者在实际操作中总结出的执尺方法;并对直角尺测量的不确定度进行的分析。  一、概述  直角尺检查仪是直角尺工作角的专用测量(检定)仪器。直角尺检查仪有:固有测量型(Ⅰ型)结构形式和连续测量型(Ⅱ型)结构形式。本文仅就固定测量型(I型)结构形式的直
期刊
摘 要:本文根据全站仪采用中间设站直接显示高差的原理,分析对井下高差测量精度的影响,通过同一工程采用全站仪中间设站直接测量高差和水准仪测量高差两种独立的测量方法实例,验证了在一定的条件下,采用全站仪中间设站直接高差法可满足井下矿山一级水准的精度要求,提出一些建议和结论。  关键词:全站仪 中间设站 测量高差  一. 前言  随着全站仪的自动化和智能化,被广泛应用于矿山井下测量,在测角和量距方面
期刊