论文部分内容阅读
随着电网技术、人工智能技术的飞速发展,变电站巡检机器人正在逐步取代人工巡检。在巡检过程中,若能利用视觉信息辅助巡检机器人的导航系统对自身所处环境进行理解与分析,则巡检机器人导航系统的可靠性获得进一步地提升成为可能。因此,本研究从二维图像场景理解的角度出发,着重研究基于卷积神经网络的变电站道路场景图像语义分割技术,通过对巡检机器人视场中出现的巡检场景图像进行语义分割来辅助其导航系统进行决策。主要贡献如下:探索了多种卷积神经网络结构对变电站道路场景的适应性。在该过程中,制作了变电站道路场景图像的语义分割数据集,该数据集包含道路类,石头类,草类,围栏类,坑类及背景等六类对象。从实用性角度出发,确定了多个评价指标用于评价相关语义分割网络的性能。以分类网络为基础,设计了基于VGG(Visual Geometry Group,Res Net(Residual Neural Network)与Squeeze Net三种不同结构类型的全卷积神经网络用于实现变电站道路场景图像的语义分割任务。综合考虑相关评价指标后,选择出了一种适合对此类场景图像进行语义分割的基础语义分割网络Squeeze Net-8S。根据所选的基础语义分割网络Squeeze Net-8S,从其基础结构的卷积方式与网络中多个网络层输出特征图融合两个角度对其结构进行了相应改进。在卷积方面,针对基础网络的fire module结构设计特点结合Dilation与Xception两种结构的设计原理及设计思想提出了D-fire-module与XD-fire-module两种改进结构,进一步根据两种改进结构搭建了D-Squeeze Net-8S与XD-Squeeze Net-8S两种改进语义分割网络。在测试中发现,对于变电站道路场景,D-Squeeze Net-8S网络在保证网络参数量不变的情况下,其语义分割精度要明显地优于Squeeze Net-8S,而XD-Squeeze Net-8S网络的语义分割精度则在D-Squeeze Net-8S网络的基础上有了少量提升,但其网络参数量小于D-Squeeze Net-8S。在多个网络层输出特征图融合方面,在跳接结构中引入了ASPP(Atrous Spatial Pyramid Pooling)结构用于改善多个网络层输出特征图的融合,针对该改进方式设计了AXD-Squeeze Net-8S语义分割网络,测试结果表明,该改进网络的语义分割精度要优于XD-Squeeze Net-8S,但由于ASPP结构的引入也使得整个网络的参数数量有少量的增加。综上,本研究针对变电站道路场景探索了多种卷积神经网络结构对此类场景的适应性,在此基础上,选择了一种基于Squeeze Net-8S的全卷积神经网络用于对此类场景图像进行语义分割,进一步从卷积与多个网络层输出特征图融合两个方面对其基础结构进行了改进,根据改进的相关结构搭建了D-Squeeze Net-8S、XD-Squeeze Net-8S与AXD-Squeeze Net-8S三种改进语义分割网络用于实现变电站道路场景图像的语义分割任务,结合改进网络输出的语义分割结果,利用图像处理手段进行了相应的后处理工作,最后实现了为巡检机器人的导航系统提供视觉辅助导航信息的任务。