基于深度学习的低质量文档图像二值化算法研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:zhan99zhan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为文档分析系统的预处理步骤,二值化分割文字与背景,这个过程在例如字符识别等要求提取的文字精确且视觉质量高方面起着关键作用。大多数二值化算法以无监督的方式构建在低级特征上,因此无法充分利用输入域知识,会大大限制前景文本与背景噪声的区分。随着深度学习在计算机视觉各个领域的广泛应用,研究者开始采用深度学习模型解决二值化问题,并取得了较好的分割效果。针对于此,本文围绕基于深度学习的低质量文档图像二值化算法展开研究,主要工作及创新点如下:(1)介绍了十二种二值化算法,其中包含六种经典传统算法与六种基于深度学习的最新算法,分别对每种算法进行简要概述,通过实验结果分析算法的优势与不足。(2)算法一首先针对神经网络训练数据集有限的问题,提出一种文本增强网络(TANet)来扩充数据集,充分利用了现有的文档图像;然后将改进后的D-LinkNet网络(MD-LinkNet)作为二值化分割网络。该二值化网络有两处改进,一是在编解码中间部分增加剩余多核池化(RMP)模块与级联空洞卷积(CAC)模块来提取丰富的文档笔画特征;二是将池化后的低分辨率图像采用DUpsample替代传统的双线性插值进行上采样,结合了文档图像的像素邻域信息。采用国际文档图像二值化竞赛(Document Image Binarization Contest,DIBCO)所提供的数据集和评估指标,将该算法与十二种二值化算法进行对比,实验结果表明,算法一的FM值相比较性能次优的DSN算法有5.1%的提升。(3)算法二针对历史文档图像文本分布不均衡,导致单一神经网络的二值化分割存在噪点现象,提出一种级联卷积神经网络来解决二值化任务的多尺度信息融合的核心问题。算法首先采用U-Net网络做基础的分割,旨在保留文档完整的笔画信息;然后将不同比例的图像测试结果进行融合,送入算法一提出的MD-LinkNet进行训练测试;最后采用卷积条件随机场(ConvCRF)进行后处理,去除孤立的噪声点。实验结果表明,该算法在保留完整笔画的同时,对于文字占比较小的文档图像可以较好的抑制噪声。
其他文献
钛酸钡填料是一种高介电材料,其与聚合物基体组成高介电复合材料已经广泛应用于高储能电容器、电缆接头和终端、微波吸收隐身材料、高容量有机薄膜电容器及生物工程等领域,但
小儿消化不良的综合治疗山西省太原市师范专科学校卫生科王芹(030001)小儿消化不良,为儿科多发病,常见病,好发于夏秋季节,以三岁以下的小儿多见,按中毒症状的轻重,可分为单纯性和中毒性消化
冲击地压是一种破坏性极强的环境地质灾害,而煤层注水技术可以改变煤的物理力学性质及热力学性质,驱替煤中的瓦斯,防治煤矿冲击地压及瓦斯突出,同时又能降低煤尘,是最积极、
介绍了以单片机AT89C51为核心的IC卡系统的设计。设计了单片机控制IC卡数据读写的软/硬件、LCD显示以及与PC机之间的串口通信。
目的:观察四神针配合耳穴贴压治疗脑疲劳综合征(BFS)的疗效,为临床治疗脑疲劳综合征提供更有效更简便的方法。方法:将60例患者随机分成2组,综合组30例用四神针配合耳穴贴压法
<正> 日立制作所已决定用液晶代替阴极射线管来制造超薄型电视机,并计划在1980年使之商品化。他们打算先生产黑白袖珍式电视机,以后再向“墙上悬挂式”和彩色电视机方面发展
伴随着新课程改革的深入,探究式教学不仅是改革提出的一种教学方式,还是新课程下高中物理教学中倡导的一种有效学习方式。探究式教学也是家长、学生以及社会都关注的话题。探
通过问卷调查、访谈等方式,对Y市三所不同层次小学的三、四年级家校沟通情况进行调查,发现Y市家校双方沟通意识强,但部分家校沟通参与者未能意识到家校沟通对学生个体生命发
传媒发展的历史证明,在媒体的成长历程中,特别是在市场价值的体现过程中,一直以来,无论是在经营资本的支持上,还是在市场风险的分担上;无论是在消费数据的提供上,还是专业服
<正> 火场物证,是火灾现场中能够客观地真实地反映火灾发生的原因及火灾蔓延的规律等情况的实物证据。正确掌握火灾现场物证的提取,有利于客观地、科学地分析火灾发展的规律