低对比度图像文字区域定位及文字识别算法的研究与实现

来源 :云南大学 | 被引量 : 0次 | 上传用户:jpjxn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字识别具有广泛的应用场景,如反作弊、街景标注、车牌定位、视频字幕识别等。为了识别图像中的文本,需要定位出文字区域。通常图像对比度越高,文字定位越容易,但低对比度的文字图像由于对比度低,以及存在文字大小、字符类型、颜色各异等情况,导致文字区域定位难。本文针对低对比度图像研究基于AdaBoost分类器和区域相似性的文字自动定位算法,实现对文字大小、中英文、颜色多样的低对比度图像自动定位与识别的目标,并利用自动定位算法定位的文字进行识别。本文首先对图像中文字定位与文字识别的国内外现状进行概述;其次,对文字定位相关理论知识进行描述;之后,针对低对比度图像文字自动定位困难的问题,提出了基于AdaBoost分类器和区域相似性的文字自动定位算法:首先对低对比度图像进行灰度化、对比度增强、边缘检测、边缘信息增强等预处理;然后利用连通区域分析方法、基于边缘和笔划宽度的统计特性训练的AdaBoost分类器分类方法、移动矩形条方法获取文字区域;之后使用组合的二值化、区域扩展与合并等方法处理文字区域,进而实现图像文字自动定位功能。为了验证本文算法的有效性,对网上搜集获得的1933幅低对比度图像进行测试,计算文字定位的查全率与漏检率,并与现有的方法进行对比,验证了本文算法可以较准确、较完整地定位出具有文字大小不一、中英文、颜色多样的低对比度图像。在完成文字区域自动定位之后,本文继续对定位的文字进行识别处理。先利用位置坐标从图像中提取文字区域,得到文字区域图像,再使用组合的二值化、腐蚀、区域填充等方法进行预处理,然后使用改进的垂直水平线投影方法进行文字切分,得到单个文字字符图像,使用神经网络进行训练与识别,输出识别结果。
其他文献
甲状腺癌(TC)是发病率最高的内分泌系统肿瘤,其中85%以上为甲状腺乳头状癌(PTC)。桥本甲状腺炎(HT)也称慢性淋巴细胞性甲状腺炎,是最常见的自身免疫性甲状腺炎。PTC与HT之间
冷战结束以来,地缘经济理论广泛应用于提高国家竞争力的政策和战略之中。以中国、日本、韩国为研究对象,东盟十国为研究区域,在Lall出口产品技术分类的基础上,以产品出口贸易
本文提出了一种分布式的铁路信号控制系统,该系统由中央处理单元、分布在轨道~侧的终端控制装置和信号箱组成。其中终端控制装置和中央处理器之间的通信采用互联网协议和光纤局
跆拳道是一项起源于朝鲜半岛的体育运动,经过半个多世纪的发展及创新,已成为世界上较为普及的体育运动。由于其具有较强的搏击性、教育性、规范性等特点而深受广大学生的喜爱
城市规模日益扩大,建筑固废物的处理成为人们关注的重点。为了节约资源并减轻垃圾填埋场的负担,资源化再利用成为一个很好的手段。目前对建筑固废物尤其是废弃混凝土的处理主要是利用它的强度性能作为再生骨料,由于拆卸过程中的结构损伤,以建筑固废物为原料的混凝土强度明显较低,存在使用局限性。材料的水力特性主要由内部孔隙决定,可以通过控制粒径级配及干密度等参数获得满足需求的水力特性,受结构损伤影响较小,因此水力特
我国有关废旧动力电池回收利用的法律法规制定较晚,具有明显的立法不足。本文从三个方面分析立法不足的表现,即缺乏有关废旧电池的专门法律,体系建设还是空白,目前尚未建立废
针对滚动轴承振动信号的非平稳及非线性特点,提出基于相空间重构与非线性流形的滚动轴承复合故障诊断方法。将滚动轴承一维振动信号重构到高维相空间,计算重构信号协方差矩阵
目的:因绝经后患者多肝肾不足,骨蒸潮热,心烦易怒,足膝疼痛或萎软,临床通过观察大补阴丸对绝经后肾阴虚型患者骨质疏松症干预,以此来验证大补阴丸对绝经后肾阴虚型患者骨质疏
随着核电站规模的加大以及数量逐步增多,对铀资源的需求呈上升趋势。基于环境和经济考虑,地浸采铀工艺亦随之加强,与传统采铀工艺相比,尽管地浸环境污染小的多,但地浸采铀中
学术语言作为影响来华留学研究生专业学习的核心要素,与专业学习有着密切的联系。随着高等教育国际化进程的加快,来华学习的留学研究生人数不断增加,留学研究生教育得到了空前的发展。但规模扩张的同时,来华留学研究生在专业学习过程中由学术语言准备不足和能力欠佳带来的难题逐渐凸显出来,亟需要得到关注。但是相关的研究较少,因此本研究选取了这个重要但缺乏关注的问题进行探究。本研究聚焦于考察学术语言对来华留学研究生专