移动终端自然场景文本检测算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lyx_suda
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景中包含着大量丰富的文本信息,从自然场景图像中提取出这些文本信息有着重要的意义。自然场景图像中的文本形式多变,字体大小不一,文本方向不定。而且自然场景图像中的文本背景复杂。这些因素都对文本的检测带来很大的困难。场景中文本的正确检测直接影响着后续文本文字的识别准确率,所以文本的正确检测对自然场景中文字处理系统起着非常重要的作用。本文的算法是在实验室的场景文字综合处理系统上完成的,这个系统是基于Android平台的。考虑到手机资源的有限性和处理速度的局限性,本文主要研究了两种适用于手机的场景文本检测算法,通过实验验证了算法的有效性,并从整个系统的角度,做了一些相应的完善工作。本文的具体工作如下:首先,本文介绍了移动终端自然场景文本综合处理系统的工作流程,给出了系统每步操作得到的结果图,介绍了本文完成的系统导航定位功能的具体实现方式,并给出系统运行时导航定位功能得到的结果。然后,本文介绍了在移动终端自然场景文本综合处理系统上实现的文本检测算法。本文提出了改进的基于笔画宽度变换的文本检测算法。笔画宽度变换运算速度快,适用于手机上的文本检测,但是在使用时,由于事先不能确定文本的梯度方向,就得不到正确的笔画宽度图。本文以此为出发点,从两个方面对算法进行了改进,一个是通过确定文字梯度方向得到图像正确的笔画宽度图。另一个是通过得到正反方向的笔画宽度图,根据一定的规则,得到正确的笔画宽度图。在本文提出的性能评价系统上进行评价,得到算法的准确率和召回率,通过得到的结果可以看出这两种改进都取得了一定的效果。最后,提出了基于连通域和角点密度特征的文本检测方法。第一种文本检测方法虽然取得了一定的效果,但是在实际应用中依然不够理想。因此本文提出了一种基于连通域和角点密度特征的文本检测方法。首先,利用彩色边缘检测和形态学处理得到二值图像,利用连通域分析算法得到候选文本区;然后,提取图像的角点特征,计算每个候选文本区的角点密度;最后,根据候选文本区的角点密度特征进行连通域滤除,得到文本区。这种方法运算复杂度低,处理简单,运算速度快。经过实验,这种场景文本检测算法的准确率提高了6.7%,召回率提高了15.5%。
其他文献
HiNOC(High performance Network Over Coax)网络是在当前FTTB已经存在和普遍应用的前提下,利用有线电视网已有的同轴电缆线路和分配网络,组建而成的最后100米范围内的宽带接
随着遥测通信对带宽和功率效率的要求越来越高,多指数连续相位调制(Multi-h Continuous Phase Modulation,Multi-h CPM)具有恒定包络、带宽和功率效率高等优势,在遥测领域得
目的:研究自滑式矫治器在AngleⅡ类错(牙合)中治疗前牙深覆(牙合)中的临床疗效.方法:通过自滑式矫治器配合固定治疗技术治疗AngleⅡ类错(牙合).结果:自滑式矫治器可随同各种
随着互联网的发展,用户对移动通信中数据业务的要求也逐渐增加,推动着移动通信业务不断向前发展.在GSM向3G发展的过程中,EDGE作为一种过渡性的技术,可以在不改变现有GSM网络
综合脉冲与孔径雷达(SIAR)是一种新型米波稀布阵体制雷达。它采用稀布阵列天线,通过各个阵元全向发射正交频率编码信号以使得各向同性照射,在接收端通过DBF和发射脉冲综合以
目的:介绍经皮椎体成形术在治疗骨质疏松性胸腰椎压缩性骨折中的应用及临床效果[1]。方法:在C臂X线机定位下对18例患者的24个椎体经皮椎体成形术,经皮椎弓根向椎体内穿刺,并
增强现实技术是将虚拟对象精准定位融入真实物体、场景中,实现对现实场景的信息增强,呈现给人们一个观察世界的新方式。随着计算机视觉等技术的迅速发展,增强现实已经成为军
近年来,随着计算机多媒体技术和网络通信技术的发展,基于内容的视频检索、访问的应用越来越广泛。而由于视频数据的内容丰富性、数据非结构化性使得视频浏览检索的效率、方便
子宫内膜异位症(内异症)是生育年龄妇女的常见病。其发病率呈上升趋势,且发病机制不清。目前,内异症的治疗方法主要为手术治疗和药物治疗,现就其手术治疗现状及疗效作一概述
认知无线电网络中,认知用户以机会的方式接入,接入的随机性及信道质量的时变性,使得可用信道资源变化得非常剧烈。多媒体数据传输时大带宽、低时延的要求加剧了网络变化。为