复杂背景图像中的文字提取算法研究

被引量 : 5次 | 上传用户:kangzeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和计算机技术的发展,图像随处可见。图像中包含着丰富的信息,文字是图像信息中非常重要的一方面,对图像起着说明和诠释的作用。因此,近年来对图像中文字的识别越来越引起人们的重视。提取和识别图像中的文字对图像分析、智能交通、机器视觉、智能控制等方面有非常重要的意义。而图像中的文字通常是叠加在复杂背景上的,一般的OCR软件很难直接对图像中的文字进行识别,从而使图像中的文字信息不能有效的利用。如何从图像中提取文字成为解决该问题的关键,也成为一个重要的研究课题。本文对复杂背景图像的文字提取主要以静态图像为对象,对于复杂背景图像中的文字定位提出了一种基于形态学和连通域标记算法相结合的方法。首先,利用sobel算法提取边缘;然后对图像进行灰度化、二值化、平滑滤波等一系列处理;最后,先利用形态学的腐蚀、膨胀、开运算和闭运算使文字信息连接在一块,然后利用连通域标记获得候选文字块区域并且根据一定的规则筛选、提取出文字块。实验证明,该方法能迅速、准确的定位文字块。在提取出文字块之后,还需将文字块从复杂的背景中分割出来,使用OSTU算法得到自适应的阈值,得获得干净、清晰的二值图像,接着对文字块内的文字进行单个字符的分割。介绍了投影法和回归式字切分的方法,先采用水平投影进行行切分并获得字符的高度信息,用来估计字符的宽度,以预测下一个字符出现的位置,然后利用回归式字切分进行单个字符的分割从而获得可以直接利用OCR软件识别的字符。实验表明,该方法可以达到比较满意的分割结果。
其他文献
大熊猫(Ailuropoda melanoleuca)是我国特有的“活化石”物种,国家Ⅰ级保护物种,被IUCN和中国濒危动物红皮书定义为濒危级。现存野生种群仅分布于陕西秦岭南麓,四川盆地西北
乌江流域民族地区教育发展的研究,肇始于民国时期。在近10年的研究中,其成果较为集中地体现在专(编)著、史志资料、学术论文等三类上。该地区教育的历史研究是研究的重点,主
本文通过介绍加拿大多元文化背景下的教师职业道德及其带给我们的启示,论述了承担中国汉语推广和中华文化传播任务的对外汉语教师(包括海外汉语教师志愿者)在面对不同国家、
由于时鲜产品具有十分显著的时效性,为了更快地将时鲜产品销售出去,很多零售商采用了捆绑销售的方式.研究了同质时鲜产品捆绑销售的最优策略问题,对同质时鲜产品捆绑销售的最
对Fe-Cr-Ni-Mo-Ti型(0Cr13Ni7MoTi)马氏体时效不锈钢激光焊接接头进行不同温度时效处理,时效温度选择在420~580℃范围内。激光焊接接头显微组织呈现出焊缝区、热影响区(Heat a
针对并联机器人轨迹规划和轨迹跟踪过程中,同时存在机构误差引起的期望轨迹与理想轨迹之间的偏差和非线性摩擦、负载变化等扰动因素引起的动态误差,提出一种并联机器人误差综
鲁迅小说《采薇》描写夷齐故事时,大量使用了围绕王国维自沉的系列"今典"。伯夷叔齐、华山大王小穷奇、首阳村第一高人小丙君等,分别对应着王国维、张作霖、梁启超等人。小说
社会个体良好的公正意识是社会公正发展和完善的内在驱动力,公正的社会制度需要社会个体对现有制度的认同与积极守制,这将更有力保障社会公正制度的落实。特别是对于大学生这
在高考招生中对少数民族考生实行的优惠政策是基于历史和现实的社会条件,为尊重民族差异、体现民族平等和教育公平原则而实施的,对于提高我国少数民族教育水平起到了很好的促
目前,随着社会对教师要求的提高,师范生的培养和专业发展成了我国高师教育所面临的严峻问题。如何促进师范生的数学信念发展与专业提升的问题成为数学教育研究的热点问题。在