基于文字条的自然场景文字检测算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ccqccqccq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,信息技术与互联网技术快速发展,与人类生产与生活各个方面的联系越来越紧密。文字,作为人类思想与情感的重要载体,蕴含着十分丰富的高层语义信息,在许多相关技术与实际应用场景中都具有重要地位。与此同时,文字在我们的日常生活中随处可见,这些因素决定了对文字检测与识别的相关研究具有十分广阔的研究价值与应用价值。目前,绝大多数自然场景下的文字检测方法均从字符检测出发,再使用后处理的方法将字符合并成文字条或单词。然而自然场景中存在大量与字符相似、难以区分的背景元素,这导致直接检测字符的难度较高、且稳定性不易保证。同时,通过字符产生文字条或单词的方法对字符检测的性能要求很高,进一步限制了这类检测算法的性能。本文则从文字条检测出发,针对自然场景下的水平文字与多方向文字,分别提出了一种基于文字条的文字检测算法。针对水平文字,本文提出了一种基于对称性特征的水平文字检测算法,该算法通过提取文字的对称性与自相似性特征,结合随机森林直接在图片上定位文字条。针对多方向文字,本文则提出了一种基于全卷积网络的多方向文字检测算法,该算法包含两个全卷积网络,分别用来预测文字块与字符中心。预测得到的文字块通过结合MSER产生多方向文字条,再通过字符中心网络检测这些文字条中字符中心的位置,并通过几何约束过滤文字条虚警,以得到最终的检测结果。我们在多个标准数据集上对这两个方法进行了测试,并与现有算法进行了全面的比较,实验表明这两种算法较以往算法在性能上均有较大提升。
其他文献
无线传感器网络(Wireless sensor networks)是由大量资源受限的传感器节点组成,通过自组织方式形成的具有特定应用背景的网络。随着现代微电子技术、无线通信技术和网络技术
商标在日常生活中随处可见,它能够为标识物体的品牌提供丰富的信息,因此商标识别技术具有极高的实际应用价值,被广泛应用于电商平台上的品牌识别和商标非法使用的检测中。但是,自然场景下的商标识别也存在许多需要克服的问题,如剧烈的尺度变换,光照的影响,仿射形变以及部分遮挡商标的遮挡问题。其中,遮挡问题是具有挑战性的问题,在真实应用场景中,常常会出现商标没有完全落在镜头内,或者商标被其他物体遮挡了一部分的情况
随着无线通信技术的成熟,以应用为背景的无线传感器网络的研究得到快速发展,但现实环境中各种不可预料的影响因素或系统本身的错误,导致无线传感器网络实际部署后的行为有时会与
随着社会经济的高速发展,城市交通拥堵问题越来越引起人们的关注。目前大部分城市路口交通信号灯的控制,是交通部门通过对车流量的调查,统计汽车流量,确定红绿灯的变化时间。由于
随着信息通信技术的急速发展,以及国家信息化战略大力的推进,IP技术在我国进入了高速发展期,得益于此,我国的互联网技术也随之迅速跟新。随着网络技术的更新,电子商务、视频下载、
LTE小区搜索就是移动终端开机以后,首次取得与服务小区的时频同步及获取小区ID的过程。这是一个非常关键的过程,因为它是用户终端与基站建立通信链路的前提。只有与小区取得
视觉对象分类是对一组视觉图像自动地进行对象分类或者判定某幅图像是否属于某个类别,定位并提取出图像中感兴趣的目标,这是计算机视觉和模式识别领域中一个热点难点问题,对
GSM-R作为专门为铁路设计的数字移动通信系统能够提供各种铁路所需的话音和数据业务,同时还可以作为CTCS-3列控系统的传输平台,承载用于列车自动控制的车地双向调度指挥信息
期刊
WCDMA是欧洲ETSI(欧洲3G标准化组织)提出的建立在窄带CDMA基础之上的宽带CDMA技术。CDMA是干扰受限系统,故它的容量和性能都受到多址干扰的限制,而多用户检测算法可以大幅度