场景文字检测及其应用技术研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户：heiefei

【摘要】

：

作为一项有着巨大前景的研究课题，自然场景图像中的文字检测与识别从一开始就受到国内外研究者的关注。它不仅对于基于文字内容的图像分析具有重要的作用，存在巨大的商业应用价

【作者】

：

邓勇

【机构】

：

江苏大学

【出处】

：

江苏大学

【发表日期】

：

2013年期

【关键词】

：

场景文字检测边缘特征 Harris角点检测形态学处理投影分析应用系统模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

作为一项有着巨大前景的研究课题，自然场景图像中的文字检测与识别从一开始就受到国内外研究者的关注。它不仅对于基于文字内容的图像分析具有重要的作用，存在巨大的商业应用价值，同时，对于人工智能的发展也具有重要的理论意义，因此受到工业界和学术界的重视。图像中的文字通常包含重要的语义信息，检测并识别出这些文字信息对于完整的理解图像具有重要的意义。作为一项基础性的研究，图像文本的检测与识别与人们的日常生活、工作息息相关，它可以应用到票务、表格、身份证件的信息读取和查询，多媒体信息服务，车辆车牌的跟踪与定位，基于视觉的汽车导航，智能机器人等众多场合，给人们的生活带来方便。　　目前，关于场景文字的检测与定位存在各种各样的技术与方法。但是由于自然场景图像中的文本与其他类型文本不同，它不仅受到多种环境因素的影响，同时文字本身属性也复杂多变，因此各种方法的检测效果都不尽如人意，迄今为止还没有任何一种方法能够快速、准确的检测所有图像背景下的文字。因此，研究一种通用性好，鲁棒性强，准确率高，并且能够对所有复杂背景下的文字实现快速定位和检测的方法仍然是一个有着巨大前景的方向。　　本文通过对相关文献的学习和技术方法的总结、分析，在国内外专家与学者研究的基础上，对自然场景文字的检测与定位进行了进一步研究和探索。　　针对场景文字的检测与定位，提出了两种解决方法:第一种方法是综合利用文字区域的边缘特征、角点特征、灰度信息，通过边缘检测，Harris角点检测和自适应的前景提取三种预处理来获得相应的文本特征图像;再通过滤波去噪和特征融合处理获得可靠的文本候选区域;最后经过形态学处理和连通域标记得到候选文本框，并采用经验规则进行精炼验证得到最终的文字区域输出。另一种方法是采用Gabor滤波和边缘检测得到相应的特征图像，接着对特征图像进行滤波去噪和形态学处理，并采用前文提出的特征融合技术得到候选文字区域;最后通过投影分析定位文本区域，并对文本区域进行二值化处理得到最终的文字提取结果。通过Matlab编程进行实验仿真测试和对比分析，证明了本文方法的可靠性与有效性，达到了令人满意的检测效果。　　另外，文章对场景文字检测与识别技术的应用前景进行了全面的总结，提出了一种基于智能手机平台的场景文字检测与识别应用系统模型，并具体说明了各个模块的功能和系统的工作原理。该系统的设计为场景文字检测与识别技术的应用做出了贡献。　　本文有效的利用了几种最可靠的特征图像和混合的预处理方法，使得它们能够相互补充，从而提高了算法对各种情况的适应性和鲁棒性，最终达到了预定的场景文字检测目标，取得了理想的检测效果。本文的研究不仅为场景文字检测技术引进了新的思路和方法，同时促进了该技术的应用与发展。

其他文献

基于STM32的联合收割机智能负荷反馈控制系统的研究

现代农业朝着精细化、规模化发展，农业生产对自动化、智能化的农业机械的需求日益增加。联合收割机作为最为重要的农业机械之一，将智能控制技术与联合收割机相结合，智能控制联合

学位

嵌入式技术μC/OS-Ⅱ操作系统联合收割机模糊自适应PID控制器智能负荷反馈控制系统

雾天图像清晰化技术研究

由于雾霾天气的大气中水汽等引起太阳光的散射，导致景物模糊，降低了拍摄场景的图像的对比度。雾天图像清晰化技术在交通导航、监视系统、遥感系统及军事国防等领域广泛应用，其具

学位

雾天图像清晰化技术暗原色先验场景深度客观质量评价算法

基于多图像的炉膛火焰燃烧稳定性研究

燃烧火焰是表征燃烧状态是否稳定的最直接反映，炉膛火焰监视系统是否投运成功，它几乎取决于所用的火焰检测器和灭火保护装置是否可靠。因此，准确监测炉膛火焰是保证锅炉安全稳定

学位

燃烧火焰图像特征区域稳定性诊断DM642图像采集装置

非线性LS-SVM逆系统主动容错控制方法研究

随着控制系统日益大型化和复杂化,提高系统运行的安全性和可靠性问题变得尤为突出,容错控制的出现和应用已成为解决上述问题的一条有效途径。由于非线性系统受自身结构、建模

学位

非线性系统逆系统方法LS-SVM数据驱动控制主动容错控制多模型控制

基于图像处理及SVM的生菜氮素水平分类预测

生菜在生长期间对土壤中氮含量要求苛刻，目前我国对生菜氮素水平的预测大多处于实验室分析阶段，具有破坏性、效率低、劳动强度大等缺陷。基于图像识别的无损检测技术具有快速、

学位

图像处理特征提取粒子群算法支持向量机生菜氮素水平分类预测

忆阻器逻辑功能电路设计及应用

随着科学技术的快速发展，集成电路的规模越来越大，同时集成器件的体积越来越小。目前传统的CMOS技术即将达到其物理极限，新型器件的开发需求越发渴望。忆阻器，作为继电阻、电感、

学位

忆阻器逻辑功能电路设计理念实质蕴涵电压种类时序步骤

助老服务机器人脸表情识别系统的设计

随着助老服务机器人智能化，基于表情识别的人机交互技术以逐渐成为研究热点。相对于语音和手势，表情交互在助老服务机器人多方式人机交互中的地位无可替代，例如对于行动或语言能

学位

助老服务机器人二维Gabor小波特征选择支持向量机表情识别系统开发

基于VB6.0与PCI数据采集卡的骨质疏松治疗仪控制系统

骨质疏松治疗仪是利用磁场产生的感应电势与感应电流来改善骨质代谢和骨重组,从而改善骨密度。主机输出不同频率、强度、波形的电流传递到治疗床的环形线圈上,产生相应的磁场

学位

骨质疏松PCI数据采集卡VBDMA传输动态链接库

基于MF的智能显示终端软件系统开发研究

.NetMicroFramework（以下简称MF）是微软公司基于.NET平台设计的新型嵌入式架构，主要针对硬件资源有限的嵌入式应用而设计。本文研制了基于MF的智能显示终端软件系统。首先分析了

学位

新型嵌入式架构智能显示终端软件系统HMI效果

一种新型数字磁通计的研制

数字磁通计是测量磁通量的一种测量仪器。数字磁通计广泛应用于磁体表面磁场测量、磁性材料生产加工以及磁性测试技术等领域。目前国内市场上的数字磁通计采用电子积分原理制

学位

数字磁通计积分器硬件电路监控软件数据采集控制系统

场景文字检测及其应用技术研究

与本文相关的学术论文