论文部分内容阅读
随着科学技术的发展与进步,人们通常需要把一些有用的信息数字化,最常见的便是把书、报刊、杂志等文档通过扫描仪扫描到电子设备中进行存储。然而,扫描仪通常需要人为扫描操作,且体积庞大不易携带。随着相机的普及程度越来越高,使用相机对文档进行数字化已成为趋势。然而,用相机对文档图像进行数字化的结果与用扫描仪对文档图像进行数字化的结果并不相同。用相机对文档数字化以后,文档图像会产生两种状态的扭曲。一种是因文档不平整而造成的物理上的弯曲,另一种是因相机成像原理而造成的透视畸变。扭曲了的文档图像一来会影响视觉的查看效果,二来会降低文字的识别率。因此有必要对文档图像进行矫正,使得用相机获取的文档图像与用扫描仪获取的文档图像相同。本文在充分考察前人的工作基础之上提出了一种新的文档矫正方法。首先,本文提出的方法不需要额外的辅助设备,即不需要诸如距离感知设备或激光发射设备等辅助设备。只需要一张普通的纸,纸上印有一些图案即可。其次,本文提出的新方案不需要多幅图像,也不需要苛刻的光照条件,同时也不假设文档边缘已经给定。本文充分利用了图像分割中的动态轮廓分割技术,只要求文档的纸张是白色即可。最后,本文提出的新方案不依赖于文档文字,即对文档的内容没有任何限制,对文档内的文字也没有任何要求。本文充分利用了文档的上下边缘,通过射影变换的技术,对文档进行矫正。本文的主要工作和成果如下:1、设计了一种上下印有棋盘格,中间印有标尺的图案,将其打印在一张纸上。在使用时只要根据书的大小将书放在标尺中的某个位置上即可开始拍照。2、基于动态轮廓分割曲线提出了一种由粗到细的文档分割方法,将文档的上下边缘分割开来。3、利用相机的模型与相机的标定原理,提出了一种基于相机标定的方法将文档的上下边缘的高度计算出来。4、对文档页面进行了优化方,删除文档中不相关的页面和部分,只保留文档中需要矫正的部分。5、最后对文档进行一次性的矫正,矫正能同时消除文档图像的物理变形与透视畸变,使得文档图像成为原始图像。