论文部分内容阅读
视觉文档图像的采集通常会因为焦距变化、角度形变等多种复杂情况的出现而使图像产生几何畸变,从而影响OCR(光学字符识别)系统识别结果的正确性,甚至导致无法识别。
针对上述问题,本文给出了一种文档图像倾斜扭曲校正方法,该方法采用四个步骤对产生几何畸变的文档图像进行校正处理。首先对文档图像进行去噪和二值化预处理;其次采用连通域标记方法进行单词及文本线的检测;再根据单词连通域的中位点信息进行线性拟合得到其校正基线;最后根据校正基线和垂直位移距离分别对单词进行旋转和位移而得到校正后的图像。
本文的主要工作如下:
(1)研究了文档图像的去噪和二值化方法,针对文档图像的单词连通域大小相对固定的特点,给出了一种基于连通域标记的文档图像去噪方法,使得在去噪的同时完成单词的检测,且去噪效果明显。
(2)针对传统从上至下的文本线检测方法利用中间段单词检测文本线,存在错检和适应性差的问题,本文给出了一种从左至右的文本线检测方法,该方法利用首单词的个数来确定文本行的条数,提高了检测的准确度,并能适应双向扭曲的情况。
(3)针对传统校正基线及垂直位移距离计算方法会受文档具体内容影响的问题,本文引入单词中多数字母的高度值Hf,取高度为Hf的字母的中位点作为基线拟合的数据,排除了单词中个别字母向上或向下凸起对校正基线及垂直位移距离准确计算的干扰,并将算法的时间复杂度从(O)(n2)降为O(n)。
实验表明,本文方法能快速有效的校正产生倾斜或扭曲畸变的文档图像,并使校正后的图像在OCR识别阶段的识别率显著提高。