论文部分内容阅读
多数历史文档图像存在背景污渍、涂抹和字迹模糊等对比度较低的情况,从而给历史文档二值化增加了较大难度。前期研究发现,历史文档中文本内容通常与文档背景的亮度水平不同,利用文档背景估计值可以有效削弱退化区域并突出字符信息;根据这两个观点,提出了一种基于对比度归一化的历史文档图像二值化算法。所提出的方法包含三个步骤:首先采用图像修复算法和Niblack算法结果来粗略估计背景;然后使用文档背景对历史文档图像存在的不同退化类型进行归一化处理,并对归一化处理后的文档图像进行增强、二值化,将文档中的文本分割出来。采用DI