自然场景中字符处理方法研究

来源 :电子科技大学 | 被引量 : 5次 | 上传用户:askkwr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景中的文本广泛存在于道路指示牌、广告牌、车牌、各类仪表等场景中。字符检测与识别日益成为计算机视觉和文档分析领域的一个热门研究问题。然而自然场景中文本的检测和识别是一个极具挑战的问题,困难主要来源于文本的多样性、背景的复杂性和成像过程中引入的干扰因素等。如果直接将原始自然场景图像送入文本识别器会造成诸多不良问题,如识别错误、遗漏文本和无法识别等。因此,精确的文本检测定位算法将极大地提升自然场景中文本识别和语义理解的准确度。本文研究自然场景中字符处理的方法主要针对自然场景中文本检测,目的是能够准确定位出自然场景中的文本,为后续字符识别的可靠性提供保证。本文主要工作内容如下:1、研究了基于MSER的字符检测算法,针对该算法无法检测低对比度图像中文本的问题,本文提出了一种基于Retinex的多颜色空间MSER字符检测方法。该方法利用Retinex增强算法提升图像的对比度,并分别提取灰度图像和HSI颜色空间中亮度通道图像的MSER,结合二者的最大稳定极值区域获得文本候选区域。经测试,改进方法在图像受光照强度影响时能有效提升字符检测性能,从而扩大基于MSER字符检测方法的应用范围。2、研究了自然场景中字符处理的常用算法,针对单一的检测算法对复杂背景的图像检测效果较差的问题,本文提出了基于MSER与SWT融合的字符检测方法。该方法首先通过计算MSER和SWT获得连通区域,然后基于二者提取到的连通区域的距离关系进行融合获得候选文本区域。经测试,该方法能有效提升复杂背景图像中字符检测的性能。3、分析复杂背景图像字符检测的结果,针对结果虚警率过高的问题,提出了对字符检测结果利用分类器进行二次验证的方法。该方法利用随机森林决策树训练样本,然后利用训练后的分类器对已经检测到的文本区域进行二次验证,从而获得最终的文本定位结果。经测试,改进方法能有效降低文本检测结果的虚警率。4、分析了用于训练字符分类器的特征,针对单一的特征并不能达到很好的分类效果这一问题,本文提出了多特征融合构成字符特征的方法。该方法分别提取区域的HOG特征和LBP特征,然后利用串行融合的方法将获得的两类特征向量融合得到联合特征向量。经过测试对比,改进的方法能够有效提升分类器的性能。
其他文献
随着核方法理论的完善以及它在实际生活中的广泛应用,人们对核方法的发展越来越寄予厚望。最主要的是核方法不仅能够应用在统计模式识别的特征向量表示上,也能够很好地应用在结
ZigBee技术凭借其在成本、功耗、速率等方面的特点在无线传感器网络领域得到广泛应用。然而,在实际应用中,因ZigBee网络节点移动或网络拓扑变化会导致较为严重的数据传输故障。
竹片缺陷检测是挑选合格竹片的重要环节。当前竹片缺陷检测仍普遍采用人工检测法,效率低下。考虑到人工劳动力成本的上升,引入机器视觉检测系统甚至是更为低成本的嵌入式机器视
分布式多舰载地波超视距雷达(DMS-SWR)是利用海上编队多艘军舰并存的自然装备资源而构造的一种分布式移动舰载地波超视距雷达系统。这种系统不仅能够弥补单载舰地波OTH雷达所
应用层组播由端系统主机来实现数据转发等组播功能,在分布式多媒体通信领域具有广阔的前景,相对于IP组播来说,具有简单、灵活和易部署性的优点。但是应用层组播的终端主机可
随着计算机技术与网络技术的飞速发展,数据库中存放的有用数据大量增加,如何从海量数据中提取出有决策价值的信息,数据挖掘成为一个很好的数据分析工具采用数据挖掘工具可以帮助
现今,通信已成为人类最重要的需求之一,同时也是吸引投资和增长最迅速的领域之一。在大家的共同努力下,各个领域中的技术进步有目共睹,但很多经典技术仍需改进,通过降低复杂
与2D成像技术相比,3D成像技术能给终端用户带来震撼和逼真的临场体验,因此在研究领域和应用领域受到了极大的关注,并被广泛地应用在3DTV、远程教育和医疗卫生等行业中。近几
火灾是一种具有较强突发性和破坏性的自然灾害。尤其在大空间建筑中,特殊的建筑结构与建筑用途使火灾发生的几率增大,蔓延的速度加快,危害的程度加深,预防与扑救的难度加大,使得消
随着现代信息技术水平的发展,卫星导航技术已经广泛应用到人类的生活中。导航应用环境的多样性,对导航接收机提出了更高的要求,如具备高灵敏度、适应高动态以及多星座兼容等等。