论文部分内容阅读
图片文字检测是文字识别过程的重要步骤,对它进行研究有着重要的理论和应用价值。在本文中,我们提出了以边缘纹理作为检测文字的主要特征。提取出图像的边缘纹理后,我们初始的系统采用简单的判定规则来进行文字区域的判定。在初始系统的基础上,我们做了多方面的改进,新的系统先对图像进行初检,然后再用训练后的SVM来进行验证,使得文字检测性能大为提高。本文完成的主要工作有两点:
1.提出基于边缘纹理和判定规则的图片文字检测算法。该算法通过小波变换提取四种方向上的边缘,用共生矩阵对边缘进行纹理分析,然后根据分析结果设定规则,判断图像区域是否含有文字,最后进行连通分量分析调整文字框。
2.提出基于边缘纹理和SVM的图片文字检测算法。该算法分析了Canny边缘的纹理特性,用SVM生成判决平面,取得了较好的检测性能。在该算法中,我们根据图片文字的特点,修改了Canny算法中的阈值选取步骤,使之适合于文字检测的需要。在文字初检步骤中,我们利用双阈值和边缘跟踪代替传统的阈值化分割,使得初检效果更加理想。另外我们对连通分量分析算法也做了一些改进。