论文部分内容阅读
对图像中文字进行提取的字符识别技术是图像处理中的一个重要应用,文字的识别率与扫描图像的质量有很大的关系,目前一般都是通过平板扫描仪得到目标图像。近年来,高处理能力、低价位、便携的数码摄像设备给文本图像的获取增加了新的手段。这些数码摄像设备能够便捷地从厚书、脆弱易碎的历史文献、场景中捕捉文字图像,这种获取文字图像的方式比使用平板扫描仪更为便捷。便携数码拍摄设备拍摄的图像和平板扫描仪得到的图像相比很不规则,存在很多的失真。为了提高识别率,在文字识别前需要对图像进行预处理。预处理中的一个重要环节是对图像进行倾斜矫正,找出文字的倾斜角度。本文提出了通过点旋转的短线段进行全角度扫描以获得黑色像素分布的新方法,能快速寻找出文本图像中文字行的倾斜角度。因为根据文字行的倾斜角度找出水平消失点,获得整个文本图像的失真情况,从而用投影变换方法纠正图像。本研究先对原始图像进行预处理,把原始图像转换成二值图像,再进行矩阵行列变换处理,转换成新的图像。然后对新图像按像素坐标进行分块,在每块区域设定一个初始点,用一根短线段穿过初始点,进行旋转扫描,对旋转过的角度进行黑色像素计算,建立旋转的角度和黑色像素数值对应关系直方图,明确黑色像素分布情况。根据黑色像素的分布情况,查找出文字行间空白,再在文字行间空白旋转线段找出文字行的倾斜角度。可以根据由多个文字行的倾斜角度,找出文字行水平消失点。本文研究的创新之处在于:(1)对经典的根据文字流向找出文字行间空白的方法进行了改进,采用了单像素宽度的线段扫描法,在行间距极其狭窄的情况下,也能找到文字行倾斜角度。(2)本方法不需要提前假设未失真文本图像形状,也能够得到正确结果。(3)不管文字图像是否全部摄入图中,还是部分摄入图中,本方法都可以检测出正确的文字行倾斜角度。(4)本方法根据点与文本之间的位置关系,设定点的移动距离,大大节省了移动点的次数,减少了大量的计算,节省了计算时间,提高了检出效率。本方法解决了现在研究中出现的一些问题:(1)倾斜角较大时不能保证校正精度;(2)空间复杂度很高,计算量较大;(3)拍摄时必须把文档的页边全部摄入图内才能矫正;(4)当文字行间距极狭窄时无法检测等。多组图像样本测试表明,本方法检出率高且高效。