论文部分内容阅读
随着计算机网络技术和多媒体技术的迅速发展,为了给人一种视觉上的美观,文本信息不再仅仅以单调的文本出现,而是与多媒体结合在一起。这些多媒体图像丰富了我们的生活,更重要的是多媒体图像文本信息给我们带来了很多便利之处。本文借鉴国内外学者已经提出的各种文本定位算法,总结和分析了这些算法的优缺点,首先本文介绍了文本区域中水平线上小间隔跳跃密集且跳跃值变化大的特征,通过这个特征应用傅立叶-拉普拉斯变换进行低频数据的剔除。然后,应用细化的方法,根据直线强度和细化骨架中的交叉点对不同文本区域进行了成功的分割,从而解决了依赖水平线或垂直线特征只能解决水平和垂直文本的定位问题。其次,删除交叉点,把交叉连接在一起的文本细化线分割成多个单独的细化线,从而分割出单个文本区域,但是有的整体文本区域被分割成多个文本区域,根据文本的方向进行合并。然而,有的非文本区域经过细化之后也会形成简单直线,与文本非常相似,本文根据边缘密度特征把这些非文本区域去除,一般有文本的区域边缘密度较大,非文本区域的边缘密度较小,即边缘长度和较大的为文本区域,边缘长度和较小的为非文本区域,根据这一特征可以有效的去除非文本区域。最后,对开发工具Matlab进行简单介绍,并设计了相应的实验,对实验结果进行分析,并对文本定位系统设计方法以及实验进行了总结。