论文部分内容阅读
自然场景中包含着大量丰富的文本信息,从自然场景图像中提取出这些文本信息有着重要的意义。自然场景图像中的文本形式多变,字体大小不一,文本方向不定。而且自然场景图像中的文本背景复杂。这些因素都对文本的检测带来很大的困难。场景中文本的正确检测直接影响着后续文本文字的识别准确率,所以文本的正确检测对自然场景中文字处理系统起着非常重要的作用。本文的算法是在实验室的场景文字综合处理系统上完成的,这个系统是基于Android平台的。考虑到手机资源的有限性和处理速度的局限性,本文主要研究了两种适用于手机的场景文本检测算法,通过实验验证了算法的有效性,并从整个系统的角度,做了一些相应的完善工作。本文的具体工作如下:首先,本文介绍了移动终端自然场景文本综合处理系统的工作流程,给出了系统每步操作得到的结果图,介绍了本文完成的系统导航定位功能的具体实现方式,并给出系统运行时导航定位功能得到的结果。然后,本文介绍了在移动终端自然场景文本综合处理系统上实现的文本检测算法。本文提出了改进的基于笔画宽度变换的文本检测算法。笔画宽度变换运算速度快,适用于手机上的文本检测,但是在使用时,由于事先不能确定文本的梯度方向,就得不到正确的笔画宽度图。本文以此为出发点,从两个方面对算法进行了改进,一个是通过确定文字梯度方向得到图像正确的笔画宽度图。另一个是通过得到正反方向的笔画宽度图,根据一定的规则,得到正确的笔画宽度图。在本文提出的性能评价系统上进行评价,得到算法的准确率和召回率,通过得到的结果可以看出这两种改进都取得了一定的效果。最后,提出了基于连通域和角点密度特征的文本检测方法。第一种文本检测方法虽然取得了一定的效果,但是在实际应用中依然不够理想。因此本文提出了一种基于连通域和角点密度特征的文本检测方法。首先,利用彩色边缘检测和形态学处理得到二值图像,利用连通域分析算法得到候选文本区;然后,提取图像的角点特征,计算每个候选文本区的角点密度;最后,根据候选文本区的角点密度特征进行连通域滤除,得到文本区。这种方法运算复杂度低,处理简单,运算速度快。经过实验,这种场景文本检测算法的准确率提高了6.7%,召回率提高了15.5%。