自然场景下的文本检测技术研究

来源 :电子科技大学 | 被引量 : 8次 | 上传用户:seair123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能交通、可穿戴设备的迅速发展,场景图像内容分析技术已称为当前的研究热点。文本检测与定位技术是进行场景图像内容分析的重要前提,文本字符对表达场景视觉信息具有重要作用,同时也是描述和理解场景内容的有效线索。提取场景图像中的文字信息未来将会在盲人导航、机器人视觉等场景有着广泛应用。本文主要对自然场景下的文本检测和定位算法进行了研究,在最大稳定极值区域以及笔画宽度变换两种算法的基础上,提出了形态学滤波的最大稳定极值区域检测算法和改进的笔画宽度算法。本文首先阐述了最大稳定极值区域算法的定义及其性质,然后介绍了对比度增强的最大稳定极值区域算法。为了解决字符粘连的问题,在对比度增强的最大稳定极值区域算法的基础上使用形态学滤波的方法进行了改进。该方法使用梯度幅度图对灰度图进行边界增强,同时通过设计8个膨胀结构元素,在图像边缘像素点处,根据图像梯度方向进行自适应的选择膨胀结构元素,有效地解决了极值区域的字符粘连问题,减少字符漏检情况。接着,本文分析了笔画宽度变换算法,鉴于笔画宽度变换算法对边缘强烈的依赖性,本文使用边缘保持滤波器进行预处理,同时针对字符交叉笔画处容易存在空隙的问题,对边缘点对约束条件进行改进,同时结合颜色信息生成笔画连通域。改进后的笔画宽度变换算法能够很好地保持字符区域的完整性,减少非文本连通域的生成,同时降低背景对字符区域的干扰。通过设计基于连通域的文本区域定位框架,分别使用形态学滤波的最大稳定极值区域以及改进的笔画宽度变换算法进行字符候选区域的提取,后续采用字符候选区域初步验证和基于支持向量机的字符候选区域验证对非文本连通域进行剔除,并使用均值漂移聚类算法进行文本行聚合,最后通过分析文本行的布局和几何关系,对文本行中的单词进行分割。在ICDAR2011数据集上对本文设计的文本区域定位框架进行测试,结果表明,本文提出的形态学滤波的最大稳定极值区域检测算法和改进的笔画宽度算法均取得了较好的效果。
其他文献
在小学音乐教学中,节奏一直都是教学的重点和难点,只有掌握了节奏才能更好的去演唱歌曲和理解歌曲的内在含义。本文从节奏的重要性和意义作为切入,以教学当中附点和切分音为
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
1考点回顾数列作为高中数学学科知识的主干内容,历来是高考重点考查的内容之一.高考关于数列的命题大致可分为2种类型:(1)考查数列本身的有关知识,如等差数列与等比数列的概念、性
自实施新课程高考以来,浙江省数学高考自主命题一贯坚持“有利于高校选拔新生,有利于推进课程改革”的命题原则,以考试大纲和考试说明为依据,从学科知识、思想方法和学习潜能出发
都市报经济新闻报道有以下特点:以市民为本位,全方位地幅射都市生活;以生活为轴心,多角度地展示都市经济形态;以服务为目的。适时地满足都市经济生活需要。都市报要真正迈入主流媒
我国的经济体制改革需要有与之相适应的思想文化和价值观念作为其支持系统。这一支持系统必须深深扎根于本国的土壤。在进行经济体制改革的同时 ,必须站在市场经济的立场对我
本文从马克思经济理论的视角考察其财政思想,指出马克思在创立科学的经济理论过程中阐发了较为丰富的财政思想。深入研究、发掘、整理马克思的财政思想,对当前我国的财政理论和
在维护国家利益完整性与统一性的前提下,关注农业、农村、农民的发展状况,重视农民的社会地位和经济地位,有关国家的长治久安和经济的协调发展.正确处理国家与农民的利益关系
以呼吸道症状为突出表现的胃食管反流病程荣墀(浙江省温州市第三人民医院内科)叶军(浙江省温州市康复医院内科)15例以呼吸道症状为突出表现而胃肠道症状不明显的胃食管反流病患者长
本工作采用应力传感器记录胃窦的运动,观察向清醒大鼠延髓中缝核注射1微升生理盐水中含6.25μg、12.5μg和25μg三种不同剂量的5-羟色胺(5HT)以及腹腔注射对氯苯丙氨酸(pCPA)