图像文本分析技术及其应用研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:muniao090908
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本是计算机视觉的许多应用中的一项重要特征。文本分析是数字图像处理和模式识别中的一个子领域,其主要目的是将文本图像转化为符号形式,从而利于修改、存储、检索、再利用以及传输。文本分析,包括字符识别在内,在模式识别领域的发展早期就已经成为研究的热点;经过近几十年的发展,这个领域已经取得了巨大的发展,并在很多实际领域中得到广泛的应用[18,31]。但是,之前的研究主要侧重于简单文本图像的分析和处理,对于字符识别也是侧重于规则文本和手写体字符的识别。而随着数字图像采集、处理和传输技术,特别是由于Internet技术突飞猛进的发展,彩色图像文本被越来越多的应用于各种场合,也就出现了大量复杂的图像文本,这给文本分析技术提出了新的要求。一般的文本图像中,或者只有文本构成,或者包含图片但是文本和图片是分离的。而图像文本中,文本是构成图像内容的一部分,与图像是不可简单分离的;而同时为了能传达更丰富的信息,其表现形式也更为变化多样。这些特点使通常的文本图像处理方法难以胜任。因而为了能有效的提取出这些图像文本中包含的内容,新的图像处理和分析方法一图像文本分析技术,就成为文本分析中的新的研究方向。 图像文本分析技术和通常的文本图像分析技术并不是完全独立的,它们之间有着紧密的联系。图像文本分析技术的最大特点就是,其所要处理的对象是具有复杂背景的一般图像,不仅包含灰度图像,也包含彩色图像;而其中的文本是作为图像的一个组成部分而嵌入在图像里面的。因此,作为图像文本分析的第一步,就是要进行图像中文本的自动检测或定位,其目的就是在图像或视频帧中提取出那些只包含文字的区域。现有的图像文本提取的方法可以分为三类:基于纹理分析技术的、基于空域连通分量分析技术的,以及基于频域分析技术的。本文提出了一种基于连通分量分析和图理论彩色聚类的彩色图像中文本自动提取的方法。首先,应用色彩的统计模型,对彩色空间进行有效的压缩,达到大大减小图像的彩色空间的目的;其次,使用基于图理论进行彩色聚类,将图像分解成对应各类的多幅二值图;然后,在这些二值图的基础上进行连通分量分析,提取可能的文本区域,并对这些区域进行鉴别;最后,综合各二值图的提取结果,得到原始彩色图像中的文本区域。和一般的基于纹理分析技术和频域分析技术的方法相比,基于连通分量分析技术的方法对图像中文本的大小和字体的变化具有更强的稳健性。提取出的文本区域经过进一步的二值化或文本—背景分离处理,就可以输入字符识别(OCR)系统中进行识别。 在实际的应用中,需要处理的对象除规则的文本外,还包含由不规则的艺术字字符构成的文本。尤其是现在的各种商业图像/图形处理软件的广泛应用,以及艺术体字符较规则字符能承载更多的信息,艺术体文本越来越多的出现在各种应用场合,特别是现在的Internet上的各种网络文本。对于规则文本的识别,到目前为止已经有大量的研究工作以及相关的文献。而专门以艺术字体字符作为对象的研究工作和文献则比较缺少。这主要是因为:1)当前的字符识别的研究主要集中于手写体字符的识别;2)艺术体字符形式的多样性而带来的识别的困难。所以,对艺术体字符的有效识别具有很大的实际应用意义。同时,现有的规则字符的识别技术已经非常成熟,在线的和离线的手写体字符的识别研究也已经有很多的研究成果。为了能有效的利用这些现有的方法,对艺术体字符识别考虑的重点将主要放在艺术字体的规则化问题上,也就是去除构成字符的艺术化部分,得到近似规则的字符。本文提出了一种基于连通分量邻接图(CAG)的艺术体字符规则化方法。该方法和现有方法的最大区别之处就是,尝试直接描述艺术体字符中作为修饰部分的结构分量的特性。基于对这些特性的分析,判断并去除字符中的艺术修饰部分,从而达到艺术体字符的规则化目的。因此,该方法和现有的方法一样,也是作为字符识别的前期处理,目的是提高现有OCR系统对艺术体字符的识别率。 最后,综合这些图像处理方法的图像文本分析技术被应用于开发一个WEB图像文本分析和处理软件。该软件能定位和提取出用户浏览的WEB页面中包含在图像里的文本,并对它们进行在线的识别和翻译,从而更加方便用户对信息的获取和理解。 在本论文中: ◆提出了基于图像文本的图像检索系统的一般结构; ◆提出了一种基于彩色统计模型和图理论聚类以及连通分量分析的彩色图像文本定位算法; ◆提出了一种基于纹理特征的彩色图像文本—背景分离方法; ◆提出了一种新的基于分量邻接图(CAG)的艺术体字符规则化方法。
其他文献
基于PCI总线的以太网控制器是现在以致将来网络应用方面的一个主要发展方向,然而激烈的市场竞争,导致我们必须不断降低芯片的成本以及提高芯片的性能来增加产品的竞争力.降低
本文首先介绍了开放式实验的特点和适合于实验室开放的仪器设备特性和开发时应该注意的要求。然后,在简单介绍DG-X系列综合电工电子实验设备系统以后,重点阐述了该系统的计算机
随着互联网应用的飞速发展,如何充分利用信息技术的成果,将传统的制造业融入当今信息化潮流,使其重新焕发活力、增强企业的竞争力,成为当今的研究热点。而远程监控系统正是为适应
该文以大连金牛股份有限公司第二炼钢厂的25MVA电弧炉生产过程改造为背景,在查阅了国内外相关文献的基础上,对电弧炉炼钢的工艺和自动化发展概况作了较为详细的介绍,并对国内
开发实用化的电力营销决策支持系统需要分析电力营销决策的过程和决策内容,在现有业务信息系统基础上确定系统开发的步骤。近年来新兴的数据仓库技术是决策支持系统新的实现形式,克服了系统实现的难点,在OLAP中结合传统的模型库实现的决策技术,可以提高OLAP的数据分析能力。数据仓库技术为决策者提供了分析环境,是决策的信息供应链,而OLAP技术灵活的分析手段以及与电力营销业务模型的融合,使得决策者通过对数据的
根据签名获取方式的不同,可以将计算机自动签名鉴定分为"联机"(on-line)和"脱机"(off-line)两大类.联机签名鉴定的数据获取包括整个签名过程本身,签名最终表示为一组随时间变
该论文提出设计实用有效的移动机器人视觉系统需要满足以下原则:视觉系统的环境适应性即鲁棒性要强.这是由移动机器人工作环境的高度动态性所决定的.环境中的诸多因素,包括光
机械臂的控制研究是一门迅速发展的综合性前沿学科,受到工业界和学术界的高度重视,同时,对机械臂的研究一直是控制领域专家的研究重点。但因其本身存在的耦合性、不确定性等
电弧炉炼钢过程是一个典型的具有非线性、时变性、随机特征的工业控制过程,而电弧炉炼钢过程的控制主要是通过电极调节系统来完成输入电功率、降低能耗、缩短冶炼时间等控制
由于现代工业过程复杂化、大型化和自动化程度日益提高,一旦在生产过程中发生故障,则会对企业的经济效益甚至人员安全造成巨大的损害。因此,对工业生产过程进行过程监测,尽可