论文部分内容阅读
字符定位是光学字符识别系统中十分关键的一步。字符定位结果的好坏直接影响后续的字符跟踪、识别的效果。然而,在各种光照条件下的字符几乎没有统一的定位方法。研究和解决在复杂条件下的字符自动定位过程中面临的若干理论、方法,能有效的提高许多产业的智能化生产和管理水平,使产业具有良好的经济发展潜能。本文在武钢高速重轨万能轧机生产线钢坯字符自动识别系统项目的背景下,对钢坯字符图像定位方法做了一定的分析与比较。通过实验分析发现传统的定位方法很难精确地定位出复杂场景中的字符区域,特别是复杂光照场景中的钢坯字符区域。为了解决这一科学难题,主要针对以下关键技术进行了深入研究,如复杂背景抑制、钢坯字符递归分割、测量与提取钢坯字符。首先提出了均值漂移和连通域特征分析相组合的方法来抑制复杂背景。结合区分度高、描述性强的核函数与窗口函数,对在线采集的钢坯号字符图像先采用均值漂移算法来抑制复杂光照背景,接着与连通域区域特征相结合,根据字符连通域特征有效的分离兴趣区域与非兴趣区域,为后续字符分割提供了基础。其次给出基于可分离判据和可分离测量的递归分割算法来分割复杂光照场景中字符图像。设计以Otsu为准则对钢坯图像进行递归分割,递归分割的终止条件取决于钢坯字符可分离判据和可分离测量的检测结果。对于逐级分割的钢坯字符图像,结合视觉不变性及准不变性,用有效的可分离判据提取分割图像中的局部字符区域。然后通过投影判据检测被提取的候选字符区域,用可度量的数据来检测提取字符区域的信息完整度。最后以可度量的数据来决定哪一级分割图像是我们想要的结果图,并最终输出准确测量后的字符位置信息。实验表明本文提出的算法能够在各种场景中精确地定位出字符区域,在复杂光照环境中具有一定的稳定性和适应性。复杂钢坯字符图像通过本文方法进行定位后,钢坯字符的识别工作(切分、识别)能够顺利进行。