文本图像页面分割和分类技术的研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:yuhmmmmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本图像页面分割和分类技术是文本自动分析研究领域的一个重要课题,它主要将图像中的文字区和非文字区分割开来,以便于文字区送入字符识别系统转化为电子文档。文本图像页面分割技术对于字符识别系统和图像压缩、图像存储系统都很重要。国内外的科研工作者在页面分割的算法方面进行了大量的研究,取得了丰硕的科研成果,但是由于文本资料版式复杂,各种分割算法一般都只适用于某几类页面版式。 本文对已有的算法进行了研究和试验,提出了两种新的分割方案: 第一种是基于高斯混合模型的分割方法。该方法根据纹理特征的不同,将不同类别的图像区用参数不同的高斯混合模型描述,最后依据最大似然概率进行判决。该算法与已有的纹理分割算法相比,不仅参数训练速度快、算法简单易实现,还不受图文混排等多种版式的限制。 第二种是基于模式链分析的分割方法。该方法将二值化图像用一条模式链表来表示,再对各个模式进行分类。本文针对文本页面图像中的版式复杂(主要指形状不规则的图片镶嵌在文字段落中)不易分割这一难题,对文献(Optical Engineering,Vol.39(3),pp.724-734,March 2000)中的模式分类过程进行了改进。首先,在按模式的统计特征分类时,只使用了最大黑游程一个特征就取得了较好的效果;其次,在模式上下文分类时,并不是对所有的模式进行处理,而仅仅对大图片模式周围个别不确定的模式进行二次分类。另外,在此基础上本文还提出了一种专门用于提取图表中文字的方法,结果表明这种方法是行之有效的。
其他文献
随着Internet 上各种新业务的需求,流分类技术在诸如虚拟专用网络(Virtual Private Network, VPN)服务、分布式防火墙(distributed firewall)、基于策略的路由(policy-based
随着VoIP技术的不断发展和成熟,电信网由电路交换网向IP网发展的趋势已越来越明显。作为在包交换网络上实现话音业务的最早尝试之一,基于H.323的IP电话网络已经较为普及,运营
基于小波变换的信息隐藏技术是近年来研究的热点。本文提出了两种基于小波变换的语音隐藏方法,把一段语音作为秘密信息嵌入一段数字音频信号中,其目的是用音频信号作伪装来传递
现代信号处理的快速发展对信号的处理速度、信号的处理带宽及信号的处理增益等指标都提出了更高的要求。对高性能信号处理技术的研究需求也日益迫切。由拥有带宽大、实时性高
网络资源的稀缺限制了现代无线网络的快速发展,由Mitola提出的认知无线电技术[1]可以一定程度上实现对频带、时隙等网络资源的有效利用,从而为各类通信业务提供更高的服务质量
目前中国的驻地网宽带接入的研究方兴未艾,而用户的接入认证技术更是其中的重点.该文通过对常见的三种接入认证方式:WEBPORTAL认证方式,802.1X认证方式和以太网上点到点协议(
偏振模色散被认为是光纤通信系统传输容量和传输性能的最终限制因素,对偏振模色散的深入认识以及如何消除其影响,是高速率和长距离光纤通信系统发展的一个重要内容。是当前国际
本文在第三代移动通信基站系统研发的基础上,着重研究了第三代移动通信中语音编码算法的优化问题.本文的主要工作是:1.着重研究了CDMA2000 1X系统采用的增强可变速率语音编码
现代数字精准农业是由信息技术支持的能够根据作物的生长发育需求和空间变异,考虑自然环境的供应能力和变化规律,精确计算作物实时所需,定位、定时、定量地实施精确供应作物生长
Turbo码具有近Shannon限的性能,它的出现被看作是信道编码理论发展史上的一个里程碑,它使人们设计信道编码的方法从增加码的最小汉明距离转向了减少低重量码字的个数(错误系数)