论文部分内容阅读
双目视觉作为计算机视觉技术的一个重要研究方向,已广泛应用于飞行器导航、测距、虚拟现实等领域。本文针对立体匹配算法开展研究,并应用于行人检测系统。本文在总结双目立体匹配算法与行人统计系统研究现状的基础上,阐述了摄像机成像模型的坐标系系统,分析了两种双目立体成像结构,阐述了双目立体视觉系统标定与校正的原理;在此基础上,给出了双目立体匹配的约束条件与相似性测度函数,以及双目立体匹配的流程,分析了局部和全局立体匹配算法的优缺点。针对传统局部立体匹配算法对于处理遮挡区域和临近视差不连续区域存在较高误匹配等问题,本文提出了基于互尺度框架的双边滤波变窗口可疑区域迭代求精立体匹配算法。在构建互尺度框架时,引入了高斯下采样和尺度间正则化项,同时动态调整聚合窗口尺寸,使得图像在粗、细尺度空间的信息更好地融合。在窗口中采用双边滤波算法求取代价权重,以提高匹配的可靠性。在视差细化阶段,提出了可疑区域迭代生长算法,通过对比像素点的RGB向量与灰度值进行视差填充。实验结果表明,本文提出的局部立体匹配算法可得到较低的误匹配率。对于全局匹配算法的优化,本文引入了图论的思想,研究了两种构建最小生成树结构的算法(Prim算法和Kruskal算法)为了更加自然地提取图像特征,在最小生成树和分割树结构的基础上提出了基于八邻接的最小分支树结构。该树结构利用了节点间梯度信息构建有向图,对图像的分割有效地区分了低纹理区域和复杂纹理区域,并提出了基于边界节点和根节点的区域聚合准则。在Middlebury标准测试集上,本文算法生成的视差图准确度优于最小生成树算法,而且具有较快的运算速度。在理论研究的基础上,本文搭建了基于双目视觉的行人识别与检测系统,采用基于互尺度的盒式滤波匹配算法,实时提取场景中的深度信息。随后,采用深度分层算法准确分离出含有人物头部的深度信息层,有效地防止了因目标粘连造成的跟踪混乱现象。在此基础上,根据形态学处理提取目标轮廓并在原视频流中对目标加以标注,实现了场景中人物目标的识别与检测。实验结果表明,基于深度分层的目标提取算法可以实时准确地提取出场景中的人物目标。最后,对本文的研究内容进行了总结,并展望了下一步的研究工作。