基于视觉显著性与颜色的复杂场景文字提取方法的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：li_qinglong

【摘要】

：

随着信息技术不断发展,数码相机与具有成像功能的智能手机已经为当今人们所常见。这些设备不仅改变人们的生活方式与文化,也产生了大量的数字图像,其中包含海量的信息。这些

【作者】

：

姜维

【出处】

：

西安电子科技大学

【发表日期】

：

2014年期

【关键词】

：

场景文字提取背景抑制视觉显著性提升框架文字置信图方向梯度直方图笔画特征傅里叶谱统计特征 HSL颜色空间光度不变量

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息技术不断发展,数码相机与具有成像功能的智能手机已经为当今人们所常见。这些设备不仅改变人们的生活方式与文化,也产生了大量的数字图像,其中包含海量的信息。这些信息中不仅囊括各种实物与场景,也包含着文字信息。数字图像中的文字信息对于人们是至关重要的,但是从数字图像中提取文字信息至今仍是一项具有挑战性的任务,也是一个亟待解决的难题。场景复杂度是场景图像文字提取算法中一个常见并难以处理的干扰因素。本文将研究重点放在复杂场景数字图像中的文字检测与定位算法的研究上,通过对人类视觉显著性与文字颜色特性的分析,设计了两种场景文字背景抑制算法(基于视觉显著性与提升框架的场景文字背景抑制方法与基于视觉显著性与文字置信图的场景文字背景抑制方法),以及一种基于HSL颜色空间的场景文字定位算法。本文的主要成果和贡献包含以下几方面:1、利用视觉显著性抑制背景且突出前景,以方向梯度直方图特征、方向梯度直方图统计特征、梯度幅度特征和梯度曲线特征的弱分类器,结合提升框架提出一种背景抑制算法。该算法首先根据谱残差理论获得视觉显著性图,再将其与校正级联提升分类器输出的文字置信图进行几何平均,最终达到针对场景文字的背景抑制效果。该算法的目标是抑制自然图像中复杂背景且突出前景文字,并作为场景文字检测定位算法的预处理阶段增强整体算法效果。在International Conference on Document Analysis and Recognition(简称ICDAR)2011文字定位数据集和实验室场景中文数据集上的实验结果表明,该算法较好的抑制自然场景中复杂背景,并有效提升场景文字自动定位算法的性能。2、基于视觉显著性与文字置信图,提出针对场景文字的背景抑制算法。该算法首先根据谱残差理论获取显著性区域,然后利用基于笔画特征的点对梯度方向差比例图与基于傅里叶谱统计特征的后验概率图取得显著性区域的文字置信图,最后借助图模型融合视觉显著性图、文字置信图与HSL颜色特征,达到抑制自然图像背景并突出前景文字的效果。在ICDAR 2011文字定位数据集与实验室场景中文数据集中的实验结果表明,该算法作为场景文字自动定位算法的预处理阶段,可较好地抑制自然图像中复杂背景,并有效提升算法的性能,同时可以较好应对旋转与倾斜的文字。3、提出基于光度不变量的角点类别特征与边缘幅值方向梯度直方图(Histogram of Oriented Gradients of Edge Magnitude,简称HOG-EM)统计特征,并据此设计了一种两级多层复杂场景文字定位算法。该算法首先获取边缘图像并在HSL颜色空间提取8层二值化图像,将其组成9层子图并做连通域分析提取文字候选区域;然后提取文字候选区域的角点类别特征与HOG-EM统计特征,将二者分别用于剔除非文字候选区域和验证文字区域。在ICDAR 2003文字定位数据集与实验室场景中文数据集中的实验表明,该算法可较准确剔除纹理丰富的背景区域,有效降低复杂场景文字定位算法的虚警率,取得较理想的准确率和召回率。

其他文献

桂枝麻黄各半汤临证举隅

桂枝麻黄各半汤出自《伤寒论》,其组方简单,是桂枝汤和麻黄汤按照1∶1比例合方小剂,临床多用于荨麻疹治疗。该方虽简但组方精妙,以桂枝汤调和营卫,益汗液之源,麻黄汤解表散邪

期刊

《伤寒论》桂枝麻黄各半汤临证

系统论信息论控制论在建设项目投资控制中的应用探讨

为有效地进行建设项目投资控制 ,运用系统论、信息论、控制论的观点 ,把项目投资决策与实施作为一个信息系统和反馈系统 ,构建科学的建设项目投资控制机制 ,使我国建设项目投

期刊

系统论信息论控制论建设项目投资控制

基于涡流线圈提离效应的深裂纹检测方法研究

为了提高涡流探头检测厚壁结构中深裂纹的能力,使用ANSYS有限元模型研究了圆形和矩形两类涡流激励线圈的提离效应对涡流渗透深度的影响,发现当线圈轴线和材料表面之间的夹角

期刊

涡流检测涡流探头提离效应性能优化深裂纹

医院档案管理工作创新的探讨

医疗事业的快速发展，让更多的人成为医疗事业的受益者，医院的各项管理工作得到了社会大众的广泛重视。目前，医院档案管理工作仍然存在不完善现象。档案管理工作的全面性不足，创新

期刊

医院档案管理创新落后服务

清代台湾少数民族酒文化探析

清代台湾少数民族特有的酒文化现象 ,不仅彰显了其浓厚的文化习俗特色 ,显示出其社会经济发展水平的相对低下 ,同时也反映了移民与少数民族经济文化交流的频繁 ,从一个侧面印

期刊

清代台湾少数民族酒

浅析高职院校数字化图书馆信息服务模式的建构

高职院校的信息服务模式的发展，飞起建设和发展来说具有重要的影响。数字化图书馆对这种服务模式提出了更高的要求。本文在分析高校数字化图书馆信息服务存在的问题和现状的基

期刊

高职院校数字化图书馆信息服务模式

化工技师院校档案管理模式探析

化工院校档案管理应该以主动服务和协同共赢为思维，从协同管理思想指导下来解决档案管理中的问题，以改进和提升高职院校档案管理工作。本文将结合我单位特点，从档案管理模式探索

期刊

化工院校档案管理问题对策

面向低成本标签的RFID认证协议的研究

射频识别技术(Radio-frequency identification,RFID)是实现物联网(Internet of Things,Io T)的核心技术之一。如何解决RFID认证协议的安全隐私问题是射频识别技术的关键和难

学位

RFID认证协议不可分辨性可扩展性不可追踪模型形式化编码方法所有权转移

纳米碳在甲状腺乳头状癌中央区淋巴结清扫中的对照研究

目的研究纳米碳在甲状腺乳头状癌中央区淋巴结清扫中的辅助作用及临床意义。方法选取2014年9月至2014年12月就诊的甲状腺乳头状癌患者57例，随机分为纳米碳注射组与空白对照组（

期刊

甲状腺肿瘤纳米管碳淋巴结切除术Thyroid neoplasms Nanotubes carbon Lymph node excision

DMS,并非简单的“营销”二字!

期刊

旅游目的地旅游营销旅游整合营销传播DMS旅游消费者行为

基于视觉显著性与颜色的复杂场景文字提取方法的研究

与本文相关的学术论文