自然场景文本提取方法研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户：ymhd_hhxx

【摘要】

：

随着计算机、多媒体以及通讯技术的飞速发展，相当数量的文字信息正越来越多地以图像形式出现。图像中的文本是图像内容的一个重要来源，如果这些文本能自动地被检测、分割、识别

【作者】

：

胡德婷

【机构】

：

中国地质大学(武汉)

【出处】

：

中国地质大学(武汉)

【发表日期】

：

2008年期

【关键词】

：

文本提取金字塔分解边缘检测二值化数学形态学连通域分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机、多媒体以及通讯技术的飞速发展，相当数量的文字信息正越来越多地以图像形式出现。图像中的文本是图像内容的一个重要来源，如果这些文本能自动地被检测、分割、识别出来，则对图像语义的自动理解、索引和检索是非常有价值的。自然场景中的文字包含着丰富的信息，如街道名称、商店名称、路标、交通标示、字幕等，这些信息对于图像的自动注释、索引等方面有重要的参考意义。因此人们对这些文本的分割和识别进行了广泛的研究，并已有许多成熟的技术应用在各个领域，如交通管理中的汽车牌照识别和港口货物管理的集装箱编码识别等。但自然场景中的文本分割依然面临着许多复杂的问题，主要原因是：(1)文字和其他自然景物混杂在一起，如树、窗户和房屋建筑等，背景复杂；(2)文字的颜色多种多样；(3)文字的字体和大小复杂多变；(4)光照的变化等。因此从自然场景图像中提取文本是一项极具挑战性的工作。目前已有的文本区域提取方法大致可以分为四类：基于边缘的方法，基于纹理的方法，基于连通域的方法和基于学习的方法。基于边缘的方法对于边缘丰富、背景具有较大对比度的文字区域能够达到快速检测文字的效果，而对于复杂的背景图像误判率比较大，容易出现较多的错误；基于纹理的方法主要是利用文本和背景的不同纹理特性将文本从背景中分离出来，但这类方法对于文本的字体和风格比较敏感，存在着定位不准和算法复杂度高的缺点；基于连通域的方法具有较高的处理速度和定位精度，但是当背景复杂或文本与背景颜色相近时分割困难；基于学习的方法对不同尺寸、不同语言和不同字体的文本具有通用性，但文本提取的结果易受训练样本集与测试样本集的相似程度的影响。在仔细分析了前人的工作基础之上，针对自然场景图像中文本的特点，本文按照多分辨分析，彩色边缘检测，后处理和连通域分析四个步骤，提出了基于边缘和连通域相结合的方法，对自然场景图像中的文本提取进行了研究。由于自然场景图像中字符的大小变化范围很大，为了能够找出大小不一的文本区域，本文采用金字塔分解的多分辨分析方法将图像分解为原分辨率的1/1、1/2、1/4和1/8的四幅子图，然后对每幅子图应用相同的文本区域提取算法。在边缘检测过程中，本文通过对Laplacian边缘检测算子进行扩展，提出了一种新的彩色边缘检测算法。将彩色图像看成是具有各灰度级的R、G、B三幅图像，然后使用基于二阶微分的Laplacian算子分别在R、G、B三幅图像上进行边缘检测，采用欧氏距离将各个彩色分量进行综合考虑，这样既保持了彩色图像中信息的完整性，又考虑到了彩色分量间的关联性。在后处理过程中，本文通过去除长直线，并运用形态学开、闭、腐蚀和膨胀等运算，设计了一套处理方法。该方法不仅能够去除部分背景区域，将文本和相连的背景分离，而且文本矩形区域定位较准确。在连通域分析过程中，先对二值图像进行连通域的标记，然后进行文本区域的验证，再将多尺度图像中的文本区域进行合并，最终得到定位的文本区域。实验表明，本文的自然场景文本提取方法能较好地将文本区域从自然场景图像中提取出来，具有较高的准确率和召回率，文本区域定位准确。但该方法在处理有光照和运动扭曲字体的图像时效果不是很理想，对文本区域阈值的依赖性较强。因此在选取有效的阈值和设定约束条件的方法上需要进一步研究改进。

其他文献

园林信息管理模型的设计与实现

本文主要研究了对园林数据的存储组织、查询管理和统计分析。利用地理信息系统(GIS)技术、数据库技术设计开发出园林信息管理模型，实现对公园绿地、附属绿地、行道树、古树名

学位

地理信息系统数据库信息管理系统园林信息

EPDL语言继承的编译实现

随着越来越多的成功软件系统成为了遗产系统(legacy system)，软件演化的重要性和普及性越来越强。软件演化已成为软件生存周期中最重要的形态之一，进入了软件的各个领域，成为了

学位

软件系统遗产系统软件演化过程描述语言软件开发

一种新型的用户兴趣模型的构建与应用

随着Internet的迅速发展，各种信息以指数级的速度增长，类型也越来越多。如何有效地解决信息过载和信息迷失带来的种种问题，如何满足各种用户不同的个性化需求等，是研究人员面临的

学位

用户模型兴趣特征词SVM文本分类兴趣更新

若干生物信息数据并行处理研究

在生物信息领域，基于多种相互作用检测方法，产生了大规模蛋白质相互作用数据;随着下一代测序技术的快速发展，产生了大量的DNA序列数据;由于蛋白质定量精度的提高，现代质谱仪器产

学位

生物信息学数据并行处理算法优化

面向交互式数据探索的规则挖掘技术研究

分析师常常通过数据探索理解数据内在规律和模式，验证猜想和理论。传统的数据探索常常通过试错的方式来对数据中的规则进行逐个验证，这在小的数据集上尚且可行，但随着大量的商业

学位

数据探索交互式框架规则挖掘

基于GIS的城市地质空间数据库的开发与应用

随着城市数字化的发展，在现代化管理中，对优化城市的布局结构、城市基础设施、生态环境等城市地质调查工作提出了更高的要求。又因地质资料包含的信息量的巨大，借助地理信息系统

学位

地理信息系统城市地质空间数据库数据仓库模型数据

基于角色和信任度的进程访问控制

访问控制是信息安全的重要组成部分，在开放式信息系统中，访问控制是保证信息系统安全的一项重要措施；病毒、木马在互联网环境下对终端计算机系统造成的危害越来越严重。一个重要

学位

基于角色信任度访问控制权限信息安全

基于单元阵列的电子表格计算语义错误检测与修复

电子表格是当前广泛使用的终端用户开发工具，并广泛应用于数据记录、金融、教育等多个领域。电子表格中的数据与公式都具有一定的计算语义，当电子表格中的数据或公式未能反映终

学位

电子表格单元阵列计算语义错误自动化检测自动化修复

单处理器下非周期实时任务调度研究

本文对单处理器下非周期实时任务调度进行研究。单处理器系统具有结构简单、开销低廉的特点，应用十分广泛。研究单处理器实时系统调度方法，不仅能够丰富实时系统理论，还对实时系

学位

单处理器非周期任务实时调度准入控制系统利用率

VMI与TPL集成的信息支持平台的设计与实现

近年来，企业与企业之间的竞争已经逐渐转向供应链与供应链之间的竞争，而在供应链管理环境下，库存管理对于供应链的成本和服务水平都有着非常重要的影响，为了解决传统库存管理的弊

学位

VMITPL信息支持平台供应商管理库存

自然场景文本提取方法研究

与本文相关的学术论文