场景图像中的文字检测算法研究

来源 :北方工业大学 | 被引量 : 1次 | 上传用户:charse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像文字检测与识别在计算机视觉领域有着广泛的应用。文字图像大致可以分为两种:文档图像和场景图像。与文档图像相比,场景图像文字的多样性和背景的复杂性给文字检测带来诸多困难。文字检测是文字识别的前端,本文对场景图像中的典型文字检测算法进行研究,分析了这些算法的优缺点,并在此基础上改进了 MSER算法和FASText文本检测器。主要研究内容包括以下三个方面:1.经典文字检测算法的研究。本文总结了21种主流算法在公开数据集ICDAR上的文字检测效果,数据显示现有文字检测算法依然存在低召回率的问题,召回率最高仅达83%。对候选文本区域提取和文本/非文本分类两大核心步骤中典型算法的优缺点及存在的问题进行了分析。2.基于Harris角点的MSER的文字检测方法。针对传统的MSER算法检测到的区域数量过多的问题,提出遍历所有角点提取候选区域的方法。首先为了尽可能全面地检测到角点,对Harris角点检测算法进行改进,从R、G、B三个颜色通道分别检测角点,对所有角点取并集,并使用最近邻插值构建了金字塔结构的多尺度空间。然后根据MSER算法原理,对每个检测到的Harris角点生成区域。实验结果表明,改进的算法在保证不漏检文字区域的前提下,有效减少了候选区域的数量。3.FASText文字检测器的改进。针对文字重复检测和非文字区域误检的问题,首先根据FASText关键点的分布特征和颜色属性滤除伪关键点,然后使用扫描线种子填充算法提取候选区域,并通过非最大值抑制减少文本重复检测,最后设计双阈值分类器进行文字/非文字分类。实验结果表明,改进的FASText文字检测器文字检测的准确率为91.3%、召回率为72.5%、F-指数为81.2%,与原算法相比,均有所提升。
其他文献
随着计算机技术与仪表技术的迅猛发展,在工业生产过程中大量过程数据被存储,基于数据驱动的过程监测与故障诊断方法得到了广泛的研究与应用,然而在众多的基于数据驱动的方法
基于图像的人脸年龄估计,是计算机视觉和图像处理领域的热门课题。尤其是在社会老龄化不断发展的今天,自动人脸年龄评估不仅对刑事侦查、图像检索和智能监控等领域有积极作用
随着现代计算机技术的迅速发展,视觉目标跟踪技术已经成为当前研究的重要问题之一。因为图像处理技术水平的逐渐提高,模式识别准确率相比较之前已经有了很大的提升,并且随着
混凝土是由粗骨料与水泥砂浆基体组成的复合材料,为研究粗骨料与水泥砂浆的协同作用对混凝土力学性能的影响,进而优化粗骨料与水泥砂浆的选材和用量,在保证工程质量的同时,降低工程成本。针对上述问题,本文主要通过改变粗骨料粒径大小、粗骨料体积分数、水泥砂浆强度、轻骨料体积分数和轻骨料取代率等几个参量进行混凝土力学试验,探究两者的协同作用对混凝土力学性能的影响。同时,提出水泥砂浆包裹厚度的概念以对混凝土设计规
图像处理方法广泛应用于各个领域,需要针对不同图像的劣化情况选择合适的处理方法以获得更好的图象质量。许多用于目标跟踪、空间导航、道路监测等的视频图像处理系统对于天
网络控制系统可以分为对网络的控制、通过网络的控制和综合控制三个研究领域。本文属于通过网络控制的范畴,研究的主要内容是超采样模式下网络控制系统的控制器设计及可镇定
对称理论在非线性方程的求解中起着重要作用。随着科学技术地不断发展,在对此理论的研究中,符号计算作为替代手工计算的一个重要研究工具具有越来越重要的地位。本文基于符号
第五代移动通信系统正在完善与搭建的过程中,而大规模MIMO技术被认为是5G关键技术之一,受到业内人士的广泛关注。在大规模MIMO系统中,为了3D-MIMO技术的实施,高效且精确的DOA
世界的发展和生活质量的不断提高使得每个城市的汽车数量都呈指数增长。为了保证停车场和道路上的汽车的安全,安保人员是有限的。为了帮助安全和协助,正在使用几种对象检测和
AUV是具有智能行为的高级自主水下机器人,它具有活动范围大、机动灵活、隐蔽性好的特点,自主水下机器人系统是海洋探测和开发,以及完成各种水下智能作业任务的重要工具,AUV技