自然场景下的文本定位

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:grchenpk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们生活水平的提高,人们持着手机、数码相机拍摄自然场景中的文本图像,它们即可自动把图像中的文字转换成可编辑的文本资料。自然场景文本定位是一个具有很大难度性和挑战性的研究课题。其原因是文本所处的图像或视频的背景非常复杂,图像或视频有的在室内拍摄而有的在室外拍摄,光照条件变化大,其中不同文字的颜色、亮度、字体、大小、间距、对比度、排列方向和背景纹理等差别很大。 要提取自然场景中的文本,首先要找到包含文本的区域,然后才能交给文本识别模块OCR进行识别。本文结合科研项目,综合利用文本的边缘特征和纹理信息,对自然场景下的文本进行定位。首先对彩色图像的RGB三色分量分别提取边缘提取,求取最大边缘,而后经过长直线和孤立噪点删除、形态学处理和连通区域分析,得到备选文本区域。由于提取出的备选文本区域中非文本区域比较多,后期作者经过Gabor滤波器组对备选文本区域进行纹理分析,在频率参数的选择上用到了Fisher判决,最后根据滤波后图像的方差进行判别,得到文本区域。 实验结果表明,本文所提出的文本定位方法具有新颖之处,本方法不但可以准确地定位出相应的文本区域,而且可以有效降低误判率,具有一定的理论价值和较高的实用价值。
其他文献
学位
期刊
学位
学位
学位
学位
学位
学位
学位
期刊