论文部分内容阅读
图像作为一种历史悠久的信息载体,自古以来在人类的生活和工作中都起到了非常重要的作用。随着高科技的飞速发展和电子数码产品的普及,图像越来越多的被应用到人们生产和生活中。但是,图像在采集、传输过程中可能会因人为因素或物理因素不可避免受到不同强度的噪声干扰,不利于后期图像的处理和使用。因此,图像去噪成为图像研究领域极其重要的一个分支。藏文文字作为藏族人民的书面交际工具,不同于汉字和其他普通图像。由于藏文文字结构的复杂性,目前对藏文图像的研究还不是很发达,尤其藏文版面去噪方面鲜有研究。本文结合汉字和普通图像去噪方法以及前人的研究基础上,利用BM3D和Dn CNN两种噪声模型,开展了以下几个方面的藏文版面去噪方法研究:1.前期数据处理。实验采用的数据集是藏文版面图像,为了更好地学习并提取图像的特征,实验训练过程需要大量的训练数据。通过切片的方法将较大的版面裁剪为256?256尺寸的图像,以便满足硬件要求及提高训练速度,并且达到扩充数据集的目的。对切片后的图像进行灰度化,能够降低计算复杂度,缩短训练时间。对藏文版面灰度图进行加噪处理,分别加入不同等级的椒盐噪声,作为网络的输入。2.采用了一种基于BM3D的藏文版面去噪方法。将含噪图像输入至BM3D模型。处理过程主要分两步,第一步是基础估计,通过各个块之间的相似程度进行分组,先进行协同滤波,再对三维矩阵进行3D变换,最后对有重叠的块通过聚合得到图像的基础估计。第二步利用第一步得到的基础估计图像,对每一块进行第二次估计和块匹配,对匹配之后形成的两个三维矩阵进行维纳滤波,最后通过对重叠块的估计进行加权平均得到最终估计,输出去噪图像,结合去噪后图像的峰值信噪比,实验结果表明,该模型用在藏文版面上去噪效果良好。3.采用了一种基于卷积神经网络的Dn CNN藏文版面去噪方法。针对藏文文献版面,对藏文版面数据集添加不同强度的椒盐噪声,训练过程中选择合适的网络结构,如采用3?3大小的卷积核,采用17层的网络深度,并通过调整训练次数选择去噪效果最优的网络模型,不断优化得到目前在藏文版面去噪效果最佳的训练结果。训练完成后将测试集输入网络,根据藏文版面测试集去噪结果分析模型在不同噪声强度下的去噪效果。实验结果表明,Dn CNN去噪算法在藏文版面上去噪效果良好。对比两种模型在藏文版面上去噪后的峰值信噪比,得出,Dn CNN去噪方法相比BM3D去噪方法在藏文版面上能够取得更好的去噪效果。