论文部分内容阅读
基于立体视觉的目标识别及定位是智能交通、智能驾驶等领域关注的热点问题。安装于无人机上的双目相机识别及定位系统,能及早获取车辆等交通目标的状态和相对位置信息,以高空视角对道路上的车辆等目标实时监测定位,便于获取大规模自然驾驶原始数据及其驾驶模型。探究基于无人机动平台下对车辆等目标进行识别与定位技术,本文的研究重点设定为:对于采集到的视频帧图像进行图像增强以及二值化等预处理操作;引入传统的算法以及卷积神经网络相结合的技术方案对目标进行识别;采用双目定位技术对目标进行三维位置分析,并在嵌入式设备上运行实现提出的算法方案,具体研究内容如下:(1)在目标的获取方面,首先通过双目相机采集视频数据,对视频序列分解为图片数据,然后对图像进行中值滤波降噪消除图像噪声。再通过反对数函数增强的方法对图像进行增强处理,最后采用传统的Mean shift算法与OTSU算法分别进行了实验,确定采用OTSU算法对图像进行二值化分割,节省计算空间。(2)使用卷积神经网络的方案对目标进行识别:改变原有SSD算法中常规的背景特征提取网络,本文引入最新的MobileNetV3轻量级网络替代VGG16作为特征提取的部分,融合SSD算法构建了MobileNetV3-SSD网络模型,并与目前比较优秀的检测识别算法进行了多方面的对比分析。实验结果证明:Loss函数迅速下降,MAP相对于一阶段检测算法有稍许的优势,相对于二阶段检测算法则损失了一些精度,但是在检测速度方面则达到了32FPS,具有明显的优势,也验证了提出的网络模型算法的有效性。(3)在三维定位研究中,采用半全局的算法进行距离的测量定位。针对半全局立体匹配SGBM算法存在的误匹配以及实时性较差的缺点,本文利用组织相近约束条件改进了RANSAC算法,加快了RANSAC算法的计算速度,采用Fast算法提取图像中的特征点并利用Euclidean Distance进行特征的匹配。将在服务器上训练完成的MobileNetV3-SSD网络模型移植适配到NVIDIA Jetson AGX Xavier嵌入式设备上,使得整套算法系统在无人机嵌入式平台设备上可以实现平稳运行,并在搭建完成的无人机平台上对其进行了实验。最终的深度估计显示误差值在6%以下,验证了算法的有效性以及实用性。