低质量文档图像的二值化算法研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:deshan123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文档图像二值化是文档分析与识别(DAR)技术中极其重要的一个关键环节,二值化的好坏对整个DAR系统的性能起着决定性作用。由于低质量文档图像自身的复杂性以及退化因素的多样性(如墨迹浸润、页面污迹、光照不均、背景纹理等),要找到一种适应各类型退化图像的二值化算法成为学术界关注的热点问题。本文的主要工作如下:(1)针对退化图像常有的弱对比度现象,提出基于高对比度像素检测和笔画宽度变换的二值化方法。该算法首先对输入的彩色文档图像进行最小均值(Min-avg)灰度化,既能增加前景与背景的对比度,又减小了前景像素间的灰度差异;其次采用非线性双边滤波算法滤除噪声,由于结合了像素空间邻近度及灰度相似性,具有保边除噪的优点;然后通过局部对比度增强技术,使图像具有明显的双峰特征,并利用全局最优阈值法(Otsu算法)检测出高对比度像素作为“种子”像素;最后,采用笔画宽度变换算法(SWT)估计图像的笔画宽度,并确定滑动窗口的大小,从而实现基于邻域窗的局部精细二值化。结果表明,该算法在抑制背景的同时,能较完整地保留字符前景,实现正确分类。(2)针对低质量图像存在复杂变化的背景特性,提出基于背景估计和能量最小化的二值化方法。首先沿用了前述算法的预处理过程(最小均值灰度化和双边滤波去噪);然后通过形态学闭操作估计出图像的大致背景,并根据差值图像确定高置信背景像素,从而去除估计背景;之后对背景减除图像构造Laplacian能量函数,基于此能量函数将图像映射为图结构;最后根据图论算法的原理,采用网络最大流方法使能量函数取最小值,求得最优二值图像。实验表明,去除估计背景后的图像对比度有明显提升,前景与背景的分割更精确。(3)对本文研究的两种方法和七种经典方法进行对比分析,选用国际文档图像二值化竞赛(DIBCO)评判指标作为衡量评价算法性能的指标参数。实验证明,本文两种方法相比于性能较好的LMM算法在F-measure上分别有0.5%和3%的提升。
其他文献
本提要分两部分:第一部分谈一谈期末复习的总体要求;第二部分主要讲一下期末复习的重点。
结合BIM技术在岩土工程勘察中的应用价值,分析BIM技术在岩土工程勘察成果三维可视化中的应用,施工企业通过岩土勘察可全面掌握工程项目具体参数,充分发挥BIM技术作用构建三维立体模型,便可有效提高施工方案的可靠性,基于此,对勘察成果三维可视化展开研究,为工程建设提供参考。
随着互联网技术的迅速发展,数据源种类日益增多,数据规模的不断扩大,企业中不同部门的不同的业务依赖于不同的数据源,为了保证数据质量,可以采用数据监控的方式,需要设计一个数据监控系统解决此类数据监控问题。本文首先介绍了项目的背景和相关技术,在此基础上,对系统的用户角色、功能性需求和非功能性需求进行了详细的剖析,对系统的软件架构、功能模块、数据模型和接口进行了设计,对系统的主要功能模块的内容进行了详细的
目的观察超声引导下腹主动脉下段球囊临时阻断术联合剖宫产治疗凶险性前置胎盘(PPP)的效果。方法选取60例植入型PPP患者为研究对象,根据治疗方法不同分为两组,各30例。对照组
目的探讨卡贝缩宫素在临床运用中预防宫缩乏力性产后出血的疗效分析。方法选择2014年12月至2016年12月在我院就诊的宫缩乏力、产后出血高危因素的400例剖宫产孕妇,随机分为实
许通海先生是福建微雕的代表人物,他将"为艺术而雕,为文化而雕,为历史而雕"作为创作之本,形成了小中见大、微中藏精、虚实相生、形意相成的艺术特点;以人文观照自然万物的创
工业厂房受勘察设计和施工的失误的影响,非正常使用,荷载众多且使用环境恶劣等因素的影响,很容易出现一些安全隐患问题,使厂房工作人员的生命安全受到巨大的威胁。为此,分析
<正> 本文报告自1972年6月~1987年12月,颅骨修补术100例,男性89例,女性11例,年龄在18~54岁之间,颅骨缺损分别发生在额颞顶枕区,其中颅脑外伤占90%,本文介绍颅骨修补的材料,手术
文档图像二值化是文档自动识别与分析的关键预处理步骤,其性能优劣直接影响系统的后续操作(如文字提取和识别)的准确度。由于图像受墨迹浸润、页面污迹、背景纹理等退化因素
本报讯 (记者 李志峰 实习生 白灵)一方面是全市幼儿教师缺口巨大,另一方面是大部分本科高校学前教育专业毕业生不愿意直接到一线任教。近日,记者在采访中了解到,针对当前我市公办
报纸