复杂背景下文字区域的建模与实验分析

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:gongzi2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像中存在的文字,为图像数据的索引与搜索提供许多的信息。如果这些文字能够被正确的定位、分割、识别,就能为基于语义的场景识别提供重要的依据。本文首先对近几年来国外的重要文献做了一个简单的回顾,然后针对定位算法性能的改进,为场景中经常出现的结构化或者半结构化的字体特征建立了一个数学模型,最后通过实验证明了这个模型对现有的方法是一个有效的补充。 模型的思想是基于统计的模式识别。作为准备,我们回顾了数字图像中统计的模式识别的基本概念;然后从应用出发,介绍了统计模式识别中一组重要的思想——分类与聚类,在这其中我们用一个实验详细讨论了线性分类器的设计,作为介绍,我们还讨论了二次曲线分类器和决策树分类器;在聚类分析这部分,我们回顾了一个数学模型——高斯混合模型(Gaussian Mixture Model),以及针对这个模型两个聚类算法-K均值算法与Expectation-Maximization算法。我们从数学的推导和算法的计算机实现两个角度再现了上述内容。回顾这些重要思想和经典算法,为进一步介绍我们的实验和分析做了准备。 算法的框架是由三个有序的部分组成:第一,采用了改进的带参数的有向滤波组在多尺度图像上检测并且标记出文字笔划(文字笔划看作是一个文字区域的骨架),经过标记的笔划是模型的计算单元;第二,我们选择了两个变量,针对这两个变量,在样本集上对所有计算单元进行采样,采样的结果通过高斯混合模型用K均值算法以及EM算法训练出一个概率分布;基于这个概率分布,为每个计算单元赋予一个可信度;第三,我们建立了一个基于上下文概率分布的聚类模型,每个计算单元都放在上下文中去衡量其作为文字区域笔划的可能性,并由这个聚类模型对图像中的纹理进行分类,计算出最有可能的一种聚类划分,划分的结果就是最有可能的文字区域。最后,多尺度图像上的划分结果进行一次融合以产生最后的输出。 我们工作的价值主要在三个方面体现。一是我们找到了一种比较好的提取文字特征的方法,从纹理的提取、分类、标记最后的向量化;二是我们对文字区域的特征向量做了一个聚类分析,并且实验实现了一种区分文字纹理与其他纹理的分类器;三是我们实现了一种基于纹理上下文的特征采样/训练方法,通过与文献中的方法做实验比较,基于纹理上下文的模型能产生更好的鲁棒性,从而保证了聚类算法能达到更好的效果。
其他文献
全球lT产业和互联网技术的迅猛发展,加快了社会经济的信息化进程。将计算机技术应用到政务系统,利用信息化手段构建电子政府,提高政府办公人员的效率,已成为各国政府的共识。然而
聚芯2000是研制中的一款多处理器SoC(System On Chip)芯片.相对于单处理器的聚芯1000系列,它内部集成了两个异构的龙芯1号CPU核,用于提供辅助的计算能力.作为底层硬件和上层
近年来,仿人机器人的研究发展迅速,并取得了一些优秀的成果。二足步行作为人类的基本特征之一,已成为仿人机器人研究领域最具吸引力的课题之一,受到了广泛的关注。本文主要针对仿
随着移动自组网(MANET)在军事与民用方面的应用越来越广泛,其安全的脆弱性已成为一个亟待解决的关键问题,而对许多应用来说匿名性已成为完整安全解决方案中不可缺少的一部分。
学位
学位
近年来,随着移动设备的通信以及处理能力的增强,移动电子商务由于其方便、快速的操作特点,得到了迅速的发展。然而,在移动电子商务过程中,保障交易的安全性成为移动电子商务发展的
在当今信息化技术不断发展的时代,电子政务、电子商务等企业级应用已经成为各国信息化的主要领域。为了使企业级应用开发能够满足未来业务需求的变化,并且易于升级和维护,松散耦
本文通过研究现有的特权管理基础设施PMI(Privilege Management Infrastructure)的实现方法、关键技术、主要组成及整体架构,提出了PMI系统的总体结构设计方案;在详细研究现有
分布式拒绝服务(DDoS)攻击具有攻击目标十分广泛、攻击方法样式很多、容易发起等特点,严重威胁网络安全。因此,针对分布式拒绝服务(DDoS)攻击的检测十分重要。  DDoS攻击现有
随着信息技术的飞速发展和企业信息化水平的不断提高,邮政企业内部积累了越来越多的数据。如何充分利用这些大量的数据并发现有价值的信息,为决策者提供重要的决策信息,已经成为