图像中无约束文本的定位与分割研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:lijun1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
静态图像和动态视频(帧)中的文本识别,分两个阶段进行:首先对图像中的文本进行检测与提取,从输入的原始图像中分割出文本区域,即文本检测;然后对检测出的文本区域进行识别,从输入的文本区域图像识别出相应的文本结果,即文本识别。其中文本检测和定位主要用来确定图像中文本的位置,并找出这些文本的边界框,是整个流程中最为关键的一步。文本分割尽可能去除文本周围的背景,便于随后的文本识别。计算机视觉要实现图像的处理、分析和理解,文本检测和定位是必不可少的基础步骤和关键阶段,这是本文研究的意义所在。  文献研究显示,自然场景图像中的文本识别,难以直接套用传统标准(有约束)图像中的文本识别算法,因为自然场景图像中文本字与字之间存在着尺寸大小不同、方向不同、字体不同、模糊程度不同、光照度不同、被障碍物遮掩程度不同等差异;另外实时性要求相对较高。任何文本皆由笔划组成,而笔划检测的关键在于检测笔划上的角点。角点检测常用算法SURF、AGAST、BRISK、FAST、SIFT、ORB中,FAST(Features from Accel cratedSegment Test)算法虽不具尺度不变性,但具有一定程度旋转不变性和仿射不变性,更为重要的是速度明显较快,较适合于实时应用,故本文基于FAST算法和笔划宽度转换算法,提出了一种改进FAST检测算法(iFAST-improved FAST)——一种快速文本角点检测算法,用于定位和分割图像中含有无约束文本的区域。  iFAST检测算法,首先检测图中笔划的角点,然后根据角点属性提取成文本片段,接着使用多尺度自适金字塔模型训练级联分类器以去除多余的非文本区域。该算法能快速、鲁棒、精确地检测与分割出图像中大小不同文本区域。还采用基于文本方向投票的有效文本聚类算法,将检测到区域聚集到文本行,以允许后续阶段(例如OCR模块)处理。  利用文本识别领域常用的ICDAR2013和MSRA-TD500两个数据集作为训练集和测试集,并与其它算法做了性能对比,结果发现本文提出的iFAST可以在多样性文本和多方向的文本取得较好的性能,iFAST检测算法与常用MSER文本检测算法相比,产生的区域数目减少为原区域数目的2分之1,且能检测多25%的字符,同时检测速度高4倍。采用后续分类阶段的iFAST检测算法可减少为1/7的原区域分割数目,且比MSER检测算法快近3倍。
其他文献
配网安全管理是电力工程管理的重要内容,其管理效果直接影响着电力工程建设的质量,有效减少了电力施工中安全事故的发生,提升了电力工程项目的整体质量.基于此,本文从配网安
随着位置服务的发展,定位技术成为当前应用发展的一个重要方向。室内外的无缝定位随着用户需求的不断提高而变得日益重要,正逐渐成为研究的热点。然而,与实际应用比较起来,室内外
随着科技的发展和人们生活水平的提高,我们的各个领域都离不开电,电能质量也与人们的生活和工作息息相关,因此,电力企业需采用先进的技术和管理去提高电能质量,为能源需求提
单纯架设输电线路就是一项非常复杂的施工任务,跨越高速公路更加大了设计方案的规划难度,本文分析跨越高速公路输电线路特征,探究设备类型和设备功能,思考输电线路跨越高速公
在当前为了促使电力营销工作水平得到提高,主要一大途径就是开展营销稽查工作.电力营销管理过程当中需要相关的人士切实做好营销稽查工作,这样才能够实现电力企业的健康稳定
在新电改的要求下,我国综合能源市场竞争日益激烈,这也导致电网企业不断在创新综合能源服务模式,以此顺应时代需求.在此之上,本文主要从综合能源服务的研究现状、优化策略、
越南某水电站两台机组自投运以来一直存在着主轴密封漏水问题,且越来越糟糕,严重影响了安全运行.经过多次调查和实际考证,终于找到了主轴密封漏水偏大的原因,并进行了改造处
一件装置艺术作品处于空间中,并不是作品被动地放置于空间之中,它是根据自身的需要来处置所占有的空间,并给予空间新的定义,甚至创造出它所需的空间。展出的空间其本身是一个已知的量,艺术品服从于这个已知的量,但艺术的形式与空间是可以塑造的,不断变化的。装置艺术与空间的关系不同于其他的艺术形式,它有着自身的独特性,而这种独特性的产生,其本身就是一种量变后产生的一个质变表现。  处于这样的一个互动关系,使得空
文章通过对变速恒频风力发电机发电原理研究的基础上,运用矢量变换控制技术对空载并网进行控制,并探讨了控制策略;通过仿真实验证明了空载并网方式对变速恒频发电机的有效性,
组蛋白H3与其他类型的组蛋白分子H2A, H2B, H4共同构成了真核生物核小体的八聚体核心。研究发现组蛋白H3的多种翻译修饰,如甲基化、乙酰化、磷酸化等在调控基因转录过程种发