论文部分内容阅读
近年来,随着计算机视觉的飞速发展,自动检测并定位行人在空间中的三维坐标信息的需求日益增强,准确实时的双目图像立体匹配技术和图像行人检测技术已成为学术界研究的热点。传统的半全局匹配算法在双目图像存在高斯噪声情况下,Census变换易产生错误的变换值,导致立体匹配的准确度低;而且该半全局匹配算法不加区分地限制整幅图像大尺度的视差值变化,导致视差图的膨胀、模糊。另外,传统的Fast-YOLO网络对行人相邻较近的图像的检测能力不足。为了解决上述问题,本论文重点研究基于双目图像的行人检测定位系统。首先,本论文给出基于SLIC超像素分割的半全局匹配算法,主要包括:1)使用均值滤波预处理的方法,对双目图像做均值滤波预处理,减小双目图像的高斯噪声,提高噪声环境下双目图像Census变换的准确度;2)使用SLIC超像素分割的方法,对图像做SLIC超像素分割,根据相邻像素是否属于同一超像素,动态设置能量函数的平滑系数,允许图像纹理边缘处视差值的较大变化。实验结果表明:均值滤波预处理的方法提高了噪声环境下立体匹配的准确度;SLIC超像素分割的方法可以避免视差图边缘膨胀、模糊的问题,提高了立体匹配的准确度;算法具备高效的运算速度。然后,本论文给出了一种基于Fast-YOLO的行人检测网络,重新设计了网络结构和网络功能:1)使用了提高网络分辨率的方法,使行人检测网络具有14×14的网络分辨率;2)使用了单一弹性窗口的方法,令行人检测网络仅预测1个弹性窗口。实验结果表明:基于Fast-YOLO的行人检测网络大大提高了对行人相邻较近图像的检测能力;提高了对随机类型行人图像的检测能力;算法的检测速度快。最后,结合本论文的立体匹配算法和行人检测算法,设计并实现了基于双目图像的行人检测定位系统。该系统对算法做并行优化,并设计了三维显示功能。实验结果表明,系统准确地输出了行人的三维坐标信息,并能够实现其三维显示,具有高效的运算速度,可用于实时的行人检测定位产品中。