论文部分内容阅读
文档数字化在日常工作和生活中的应用日趋广泛。非接触式的文档数字化方法如数码照相凭借其设备便携、操作简便、成本低廉、不对原纸质文档造成任何损伤等优势,在文档数字化领域尤其是珍贵古籍的数字化领域的应用日趋广泛。但是在对纸质文档尤其是厚重古籍书页拍照时,书页图像将不可避免的出现一定程度的弯曲变形,必须对其加以矫正,才能进行OCR(Optical CharacterRecognition光学字符识别)、归档等文档数字化的后续工作。本文针对这一问题,提出一种切实高效的弯曲书页图像的图像矫正处理算法。在本文的研究中,详细分析了目前国内外在该领域的各种处理算法,包括将弯曲书页的几何形状建立为规则柱面模型、推广柱面模型、Ruled Surface模型等数学模型,从而找到变形图像上与真实书页上点对点的映射关系的方法;也包括使用CT、投影仪等设备得到弯曲书页变形的深度信息,再通过质量-弹簧模型将其退化为平面的方法。但是这些方法或是受到被矫正页面内容的限制、或是需要大量手工操作、或是依赖于特殊设备,在算法应用的普及性和高效性上存在一定的问题。本文提出一种基于边缘线的三维重构实现弯曲矫正的方法。这种方法将弯曲书页的几何形状建立为具有一定普适性的推广柱面模型,基本原理为首先提取出弯曲书页图像中的书页边缘线;而后根据实际书页高度、拍摄高度、拍摄焦距等简单易得的参数,通过几何成像的理论恢复书页图像中书页边缘的三维形状,从而得到图像上弯曲书页边缘线上任意一点到书页中缝起点的真实距离;进一步在推广的柱面模型上,直接采用简便的直线线性插值方法,得到弯曲书页图像上所有点与真实位置点的映射关系,从而实现矫正。本文的方法所用的特征信息来自页面边缘,不依赖于被矫正页面的内容;仅需要一些基本的拍摄参数,无需手工操作;采用直线线性插值方法即可获得点对点映射关系,运算量很小。本文随后选取一些弯曲古籍书页图像进行了算法实现和实验研究。实验结果表明,本文提出的基于边缘线的三位重构弯曲矫正方法不仅高效快捷,而且能够保证较好的矫正精度,具有一定的实用价值。