论文部分内容阅读
由于数码相机等数字成像设备的焦距、曝光选择,以及被拍摄文档存在折痕、污渍和角度变形的原因,从而使得拍摄出的视觉文档图像产生噪声、整体明暗不均、扭曲变形等情况,这些现象轻则影响到OCR系统文字的识别率,重则无法识别。针对视觉文档图像中出现的上述问题,本文给出了噪声去除、光学校正以及几何校正等预处理方法,改善了视觉文档图像的质量,提高了文档图像光学字符的识别率。主要工作如下:1、针对视觉文档图像在获取、处理、传输中产生的椒盐噪声,提出一种基于文字笔画特性的消除椒盐噪声的算法。该算法通过判断被处理像素及其邻域像素点是否为噪声,从而有效地将文字目标和椒盐噪声加以区分。实验结果显示,相比传统的去噪和平滑算法,该方法能准确地抑制噪声,同时避免了对文字笔画的影响,减少了对后继识别的干扰。2、针对视觉文档图像存在的反渗噪声,本文根据其不同的直方图特征,分别提出处理方法。对于灰度直方图呈双峰特性的含反渗噪声的视觉文档图像,反渗印迹的灰度值与正面字迹的灰度值相差较大,可将像素值分为三个不同的区间,分别进行处理,对于中间的区间进行增强处理,而对于其余两个区间进行归一化处理,从而能够有效地去除反渗噪声;对于直方图呈现单峰特性的反渗噪声,提出一种基于背景分离的去除反渗噪声方法,经实验验证,该算法可以有效去除单峰图像的反渗噪声。3、针对具有折痕噪声的视觉文档图像,提出目标增强的处理方法,解决了折痕在识别时造成的问题,提高了OCR的识别率。4、对于模糊的文档图像,提出一种寻找文字骨架的方法,该方法能够有效地消除图像的模糊。5、对于曝光不良视觉文档图像,分两种情况进行讨论:(1)针对曝光不足的视觉文档图像所存在的问题,提出一种视觉文档图像目标增强算法,将文字图像中的目标和背景加以区分,并对图像背景进行归一化,对图像目标部分进行增强处理。实验结果显示,该方法可以有效地处理曝光不足的低对比度视觉文档图像,提高OCR识别率。(2)对于曝光过度的视觉文档图像而言,提出使用双侧增强来进行处理的方法。6、对于边缘模糊的视觉文档图像,利用小波变换将图像进行分解,根据需要对不同位置、不同方向上的某些小波分量通过扩大或缩小其系数,从而使得某些感兴趣的分量放大而使某些不需要的分量减小,使得图像得到增强,提高文字识别率。7、针对圈边文字图像,利用基于邻域跟踪的边框去除方法,有效地去除圈边及长线段。8、对于由积厚文档造成的视觉文档图像扭曲变形,利用单向伸展的几何校正方法,实现了文字行的扩大,进而分析了分栏图像的特点,并采用分段拟合校正图像的方法,提高了OCR识别率。