基于MD-LinkNet的低质量文档图像二值化算法

来源 :光电子·激光 | 被引量 : 0次 | 上传用户:xsy00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对低质量文档图像存在的背景渗透、页面污渍、边缘大面积与文本相似的噪声等现象,改进D-LinkNet框架,提出了一种融合多尺度特征(multiple scale feature)的低质量文档图像二值化算法,简称为MD-LinkNet。该算法有两处改进,一是在编解码中间部分增加剩余多核池化(RMP)模块来通过四个池化操作以提取丰富的文档特征信息;二是将池化后的低分辨率图像通过DUpsample而不是双线性插值进行上采样,结合了文档图像像素邻域信息,将文档图像的全局与局部特征进行融合,提高了分割精度。实验结果表明,在2017年和2018年国际文档图像二值化竞赛(DIBCO)数据集中,本文算法的F值(F-measure)最高分别达到了90.54、91.42,验证了所提出算法在解决多种复杂噪声背景的低质量文档图像下的鲁棒性,且相比其他最新经典算法效果较优。
其他文献
针对绿蓝悖论,西方学界有代表性的解悖方案主要包括语言主义方案、贝叶斯主义方案和证伪主义方案。我国学者陈晓平教授独立地提出不属于三种方案的消除主义方案。根据该方案,
分析了(火积)耗散与热量传递、功热转换、自由膨胀、等温物质扩散等热力学过程不可逆性之间的关系.研究表明,对于功热转换、自由膨胀和等温物质扩散3种不可逆过程,均存在熵产
南山集团已形成一条完整的产业链,生产的产品有很强的市场竞争力,特别是在高端铝产品与航空航天铝材方面已成为中国在这些领域的领军者,并在向国际上的航空航天市场进军,有的
期刊
<正>CAD(计算机辅助设计)技术是20多年来迅速发展起来的一门新兴综合计算机应用技术,它以计算机为主要手段来生成和运用各种数字信息和图象信息,以进行产品设计.CAD和CAM(计
2019年岁末,湖北发生了新冠肺炎疫情。疫情就是命令,军队快速反应,火速集结,神速支援。为了集中收治确诊患者,武汉市政府决定建造火神山医院,经过10天火速建设,于2月2日上午
对于植物新品种的保护是采用专门立法模式还是通过专利权进行保护,争议由来已久。由于各国历史文化传统以及法律制度等因素,形成了各具特色的保护模式。本文在植物新品种专门
<正>“兴象”是盛唐文学理论家殷璠在《河岳英灵集》中首次提出的一个重要的文学理论范畴。由于文学理论范畴的提出是离不开社会及文学的大背景的,所以,本文从时代和诗风两个
【正】 秦文字远绍两周文字,这已是古文字学界公认的事实,春秋后期,东方诸国的文字发生了急剧的变化,形成所谓“六国文字”,秦国久据宗周旧地,文化深受其影响,因此秦文字远不
期刊
人们关于孔子与孔学的种种论述、评议或谈论所涉及到的不外是三个层面的问题 :“实在的孔子”、“历史的孔子”和“符号的孔子”。其中后两者、特别是“符号的孔子”层面的问
事业单位会计决算报告作为年终总结事业单位一年会计工作的重要报告,是日常会计审核的基础,在一定程度上反映了该事业单位的财务收支状况以及资金的管理状况,有利于政府加强