数字图像复杂背景中文本检测与抽取技术研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:tewy001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数码相机、数码摄像机、摄像头、超高速扫描仪等图像获取设备的广泛应用,以数字图像和视频为主的多媒体信息正迅速成为信息交流与服务的主流。如何让计算机自动理解并利用图像和视频等多媒体文档的内容,已经成为当前图像处理和多媒体领域研究的一个热点。由于图像和视频中的文字直接承载了语义信息,从而使得这些文字成为理解图像内容的重要线索。为了能够检测、抽取并识别出图像中的文字,本文针对复杂背景下文本信息的检测和抽取问题展开研究,主要内容包括:   第一,针对不同复杂度的图像,提出一种基于图像复杂度分析的自适应混合边缘文本检测方法。该方法首先对图像复杂度进行分析,即将图像复杂度分为低、中、高三个级别;然后对不同复杂度的图像自适应地选择合适的边缘检测方法。其中,对低复杂度图像,采用Sobel算子进行边缘检测;对中等复杂度图像,采用Sobel算子进行边缘检测后,利用梯度的幅值和方向信息进行边缘连接,将断裂的边缘连接起来;对高等复杂度图像,本文设计了一种基于多尺度多方向的能最大限度地去除噪声并能较完整地保留文本边缘的形态学边缘检测方法。这种基于图像复杂度分析的文本检测方法结合了基于边缘、连通域和纹理的方法,采取由粗到精多级检测验证的策略,提高了文字检测率。通过分别在场景图像集和视频图像集上与其它单边缘检测方法的比较,表明了本文所提出的文本检测方法的有效性。   第二,针对复杂背景中的文本抽取问题,本文提出一种基于条件随机场的文本抽取方法。该方法将文字底层的颜色和纹理等特征信息以及空间上下文信息融合到一个条件随机场模型中,通过状态特征函数和转移特征函数描述图像底层特征和空间上下文特征。其中,对于图像底层特征,本文在考虑颜色特征的基础上,加入了Gabor纹理特征。本文比较了不同颜色空间和不同特征对基于条件随机场的文本抽取方法性能的影响,验证了该方法的文本抽取性能。   第三,为了解决在复杂背景下,只利用图像底层信息无法有效区分文字像素和背景像素的问题,本文在标准条件随机场的基础上,提出了一种基于多层上下文信息的条件随机场文本抽取方法。在该方法中,图像的颜色和纹理等特征作为图像的局部信息,标签域上下文信息作为图像的一种全局信息,通过描述图像中整体的标签分布情况,可以修正由图像底层信息引起的分类错误。通过分别在简单和复杂背景下与其它文本抽取方法的比较,表明了本文所提出的基于多层上下文信息的条件随机场方法在文本抽取方面尤其在复杂背景下的有效性。
其他文献
激光小角散射法是用激光照射结晶性高聚物,并通过高聚物球晶产生的散射图像来研究球晶大小的一种近代方法。它适用于从几百纳米到几十微米大小的结构,这与高聚物球晶大小相当,因
图像特征检测与匹配是计算机视觉中的基本问题,它们在图像配准、三维重建、物体识别、运动跟踪和视频理解等领域都具有广泛应用。本文工作主要集中于特征点的检测与匹配,主要创
学位
直升机生存力是指直升机躲避和承受人为敌对环境威胁的能力,其研究主要包括三方面内容:直升机被防空体系探测、跟踪、识别以及被威胁命中的敏感性;直升机被威胁命中后的易损性;直
本文针对图像特征检测及应用进行了深入的研究,涉及到了图像处理的一些基本问题,包括区域特征检测、边缘特征检测和角点检测等。图像特征检测是计算机视觉中的一个关键问题,在物
学位
非线性系统的输出调节问题在过去的二十年多中一直是非线性控制理论的主要研究课题之一。特别是对于下三角非线性系统,许多学者都展开了深入的研究。但是,其中大多数研究成果都
计算机排样问题是指在特定底料内排放衣片,使区域的利用率达到最大,鉴于衣片均是不规则二维图形,所以该计算机排版问题可抽象成二维不规则图形优化排样问题。   优化排样问题
随着信息时代的来临,各行各业的数据成爆发式增长,人们日常生活中无不涉及大量数据的读取与保存。作为数据存储的最主要介质——磁盘阵列,它本身的可靠性将直接影响数据的存
利用ROV代替潜水员进行潜艇供排气管对接作业是援潜救生的发展趋势,其中供排气管对接技术是为失事艇员提供生命保障的关键技术。由于水下作业环境比较复杂以及水下作业难度大
在电弧炉冶炼过程中,电极调节系统的任务是在一定的工作点下使三相电极保持恒定的电弧长度。但由于三相电极之间存在强烈的耦合,任意一相电极位置的调整都会影响其它两相,导
进入21世纪以来,随着经济的飞速发展,各种类型的大型建筑和生产厂房不断涌现,建筑能耗也在不断地攀升,能源的需求也在日益增大,面对能源紧缺和能源浪费等系列问题,节能已经被提到了