论文部分内容阅读
标志牌上包含了许多重要的信息,提取自然场景图像中标志牌上的文本具有很高的实用价值。本文提出了两种有效的文本区域提取方法:一种是基于颜色的文本提取方法,另一种是基于边缘的文本提取方法。在分析了每种方法的优点和缺点之后,将两种方法结合起来提取候选文本区域。在验证阶段,本文根据字符之间的相似性采用基于图的验证方法来滤除非文本区域。
1. 基于颜色的文本提取方法
首先进行基于颜色信息的图像分割,即通过颜色简化的方法用少量的代表颜色来描述原本非常丰富的颜色信息,并根据像素在图像平面上的分布来修正分割的结果;然后,采用启发式的方法分别对各个代表颜色子图像进行文本区域提取,并将提取的结果合并,得到候选文本区域。这种方法运算的时间短,能够有效地提取背景细节信息丰富的图像上的文本。但是,该方法不适合处理文本和背景的对比度低或者文本区域颜色复杂的图像。
2. 基于边缘的文本提取方法
首先,我们采用一种彩色Canny边缘检测方法得到边缘图像。然后,根据边缘的投影、长度、包围盒等信息应用边缘跟踪的方法有效地去除大量不规则的非文本长边缘。接下来,针对不同的字符大小范围进行分级提取,根据文本区域中边缘之间的关系,用窗口法扫描边缘图像,进一步去除分布稀疏的非文本边缘,并将合并提取的结果。最后,采用形态学膨胀的方法来进一步删除非文本区域。这种方法对文本区域的颜色信息不敏感,并且在对比度低的情况下仍然能够有效地提取文本区域。但是,该方法不适合处理含有大量细节背景信息的图像以及文本区域背景复杂的图像。
3. 验证方法
在验证阶段,本文根据同一文本区域内字符之间的相似性来进一步滤除非文本区域。根据最小生成树的原理来构造“最大相似性”树,用于分析候选文本之间的相似性,以两个候选区域在间距、色差、形状以及大小方面的相似性来构造权值函数,最终得到验证后的文本区域。该方法能够有效地滤除非文本区域,但不适合处理文本区域仅含单个字符的图像。