论文部分内容阅读
随着定位技术的发展与应用,社会对高精度的定位需求日益增加。在复杂场景、室内环境下,GNSS定位技术无法发挥作用,而视觉定位因其使用简单方便、成本低、精度高等特点得到了广泛应用,已经成为室内定位的研究热点。目前,视觉定位主要用以协助运动平台自主定位,对于移动目标的视觉定位研究较少,在应急环境下,当常用的定位技术无法使用时,此时,仅依靠视觉实现精度高、鲁棒性强的被动式定位,对获取运动目标的位置信息具有重要的理论意义与实用价值。本文围绕烟雾环境下基于双目视觉的运动目标高精度被动式定位展开了系统研究,对其中的关键技术难题进行了理论探索与技术攻关,在图像去雾、运动目标检测、立体影像匹配、目标定位等环节取得了若干研究成果:(1)在火灾、地震、井下事故等灾害场景中,伴随的烟雾、粉尘等严重影响着视频图像的质量,这给目标视觉定位造成了极大干扰。针对图像去雾,本文提出了一种端到端的深度全卷积网络模型,采用残差学习简化学习过程,构建包含两个全连接层的全卷积网络架构,将(?)2损失与感知损失相结合作为残差映射的损失函数,该模型在提高网络训练性能的同时又降低了图像去雾中产生的“伪影”(Artifacts)问题。该算法能直接学习去雾图像与无雾图像的残差,无需估计大气光值或介质传输,克服了传统去雾算法受大气散射模型的约束,实现了端到端的图像去雾,效果良好。(2)针对运动目标检测易受光照变化、目标的尺度、形状与角度变化、以及“鬼影”问题与拍摄平台固定或移动等问题的干扰,本文研究了基于光流估计的运动目标检测提取算法。该算法先从图像光流场的估计入手,分析了光流能量方程的数据项与平滑项构建的主要形式,并根据光流残差原理将抗干扰性较强的LK光流法与HS光流法相结合构成光流方程的数据项,进而构建了高精度的光流估计能量方程;然后,利用图像金字塔处理大位移像素的光流估计问题,对构建的光流能量方程进行内外嵌套迭代的方式求解,根据Delaunay三角网遮挡判定处理运动目标检测中的“鬼影”问题,获得了高精度的图像密集光流矢量场。再进一步对获取的光流矢量场进行阈值化分割以获得运动目标的前景区域,为解决传统的基于OTSU光流阈值化处理算法在相机不固定的情况下无法提取运动目标前景区域的问题,本文研究发现相机移动时获取的图像序列其背景区域符合图像仿射变换规律,据此研究了基于稳健特征点的光流阈值选取算法。提取前后帧序列图像中的特征点并计算两帧图像间的背景模型仿射变换矩阵,然后删除特征点中不符合背景模型从属于运动目标前景区域中的特征点,从而获得满足仿射变换矩阵的背景区域特征点,称为稳健特征点,将稳健点处的光流值作为光流阈值以计算运动目标前景区域的二值化图像。本文算法能够同时适用于相机移动与相机固定两种状态,对刚性运动目标与非刚性运动目标均有较为准确的检测与提取结果。(3)在多运动目标定位检测时,由于现有的大多基于光流法的运动目标检测提取算法只是初步地将所有运动目标的前景区域一起检测分割,没有进一步地对不同的运动目标进行细化分割,而导致初步提取的运动目标前景区域会出现多个目标,无法实现单体目标的识别,也无法进行后续的多目标定位。本文在实现了基于高精度光流估计与稳健特征点光流阈值化处理的运动目标区域检测提取算法研究的基础上,继续探讨了不同目标间的细化识别与区域分割。通过理论分析认为不同运动目标之间的光流大小与方向存在较大差异,基于此,本文利用光流直方图与K-means聚类分析对提取的运动目标前景区域中的光流矢量场进行聚类分析,以分割提取出不同的运动目标前景区域。实验表明本文研究的多目标分割算法不仅对刚性运动目标有着较高的识别精度,对同一运动目标内部光流差异较小的非刚性运动目标也有较好的聚类分割效果。(4)针对立体匹配中存在的目标区域变形与重复纹理的问题,本文提出了Deep Matching与立体视觉约束条件相结合的匹配算法。先计算匹配的底层关联图,并采用特征描述符度量关联图的相似性,通过降采样、池化操作、平移变换与图像正则化从下向上搭建关于图像关联度的金字塔,再由金字塔顶层回溯到底层得到密集立体匹配点对,通过匹配后处理获得最终的立体匹配结果。实验表明,本文的深度立体匹配算法在变形与重复纹理区域也具有较高的匹配精度。(5)集成应用上述算法,在模拟烟雾环境下进行了实际的运动目标检测与定位试验,结果表明本文提出的系列算法具有很好的实用效果。