论文部分内容阅读
人类通过眼睛感知的世界是立体的,这种对信息的处理方法真实地反映了客观世界。现在我们利用数码相机得到的二维平面图像,通过视觉技术可以获得更好的视觉效果图,如三维重建、超分辨率重建等。新型阵列相机的引入可以使上述过程更加简便和准确。阵列相机通过模拟多目视觉,利用微镜头组记录不同方向的光场信息,形成的二维子图像阵列可以重新建立物体的三维空间信息,因而在图像三维重建、超分辨率重建中具有较大优势。另外,由于子图像阵列记录着物体在不同位置的空间信息,因而还可以实现重对焦功能(即先拍照后对焦)。而要实现上述功能的关键步骤就是场景的深度估计。本文尝试借鉴传统的标定方法和深度估计方法,在阵列图像的框架下计算被拍摄场景的深度。相关工作如下:1.利用改进的张正友标定法对微镜头组进行标定。本文所用的阵列相机硬件部分是3×3阵列模板(9个微镜头),由于通过阵列相机最先获取的是raw格式文件,我们通过Bayer插值法将该格式的文件转化为可处理的RGB彩色图像。然后我们利用张正友平面模板标定方法,采用优化分组方法对微镜头组进行标定,求出微镜头组的内外参数和畸变参数。2.利用图割优化算法阵列图像进行深度估计。首先给每一个像素分配一个合适的标号,然后构建全局能量函数,接下来建立网络图,最后用最大流最小割定理计算最小割,进而求得最佳深度。由于阵列相机有多个镜头,可得到多幅图像,在一般情况下可认为,不同图像空间的信息具有互补性,可以得到更好的深度估计效果。仿真实验也表明,随着镜头数目的增加,深度图的效果越好,深度计算越准确。