论文部分内容阅读
图像的语义分割技术是图像理解的基石性技术,所谓图像的语义分割技术实质就是将图片中不同的物体用不同的区域块分割开来,它的目的是将图片中每一像素点进行分类。其研究成果在各个方向上都有着广泛的应用,例如自动驾驶技术、医疗影像技术分析、遥感图像分析等领域。图像的语义分割技术在过去的数十年当中由于技术原因一直发展缓慢,但是随着深度学习的研究热潮,卷积神经网络逐渐成为了计算机视觉任务研究的最核心方法,它对二维图片具有强大的特征提取能力,并且不用对原始图片数据进行特征的提取和重构。全卷积神经网络的提出正是得益于卷积神经网络的发展,该方法开创性的将卷积神经网络结构用于语义分割任务当中,在分割精度和分割速度上都远远超过了传统图像分割算法,通常,语义分割任务最主要的工作在于对图片空间位置信息的提取和对图片像素与像素间依赖关系的提取,本文基于卷积神经网络展开了深入的研究,从特定的应用场景出发,提出了一种新的语义分割模型结构。主要工作如下:
1.深入研究现今主流语义分割技术,包括了基于全卷积神经网络的语义分割模型和基于条件随机场模型的语义分割模型。然后对比分析了两种语义分割模型的优势和缺点。
2.提出了一种新的基于全卷积神经网络的语义分割模型DeepLab-Resnet18模型,该模型引入了最新的卷积结构——ResNet结构,在一定程度上避免了原始卷积过程当中会因为池化作用而丢失物体空间位置信息的问题,此外模型采用了空洞卷积技术,在保证图片分辨率的情况下有效的增加了卷积过程中的感受野大小。
3.对具体的模型应用场景进行了仔细的分析,提出了一种基于条件随机场模型的语义分割网络——局部区域条件随机场模型,它充分考虑了应用场景与模型之间的适应性,使用新型的算法优化了条件随机场模型的迭代过程,使得模型能够提取到图片像素与像素之间的依赖关系,给分割结果增加了一个平滑的过程,优化了在物体边界区域处的分割结果,并且建立了信息完整、标注尺度统一的交通场景语义分割数据集。
4.为了能够有效利用连续交通场景图片帧与帧之间的强相关信息,本文设计了一种基于卷积神经网络跟踪算法,该算法能够获取图片相邻帧之间的信息,并利用这一信息对相邻帧图片的分割结果进行错误修正。
通过实验证明,本文所述局部区域条件随机场模型能够适时高精度的扩展应用到交通场景图片的语义分割当中。
1.深入研究现今主流语义分割技术,包括了基于全卷积神经网络的语义分割模型和基于条件随机场模型的语义分割模型。然后对比分析了两种语义分割模型的优势和缺点。
2.提出了一种新的基于全卷积神经网络的语义分割模型DeepLab-Resnet18模型,该模型引入了最新的卷积结构——ResNet结构,在一定程度上避免了原始卷积过程当中会因为池化作用而丢失物体空间位置信息的问题,此外模型采用了空洞卷积技术,在保证图片分辨率的情况下有效的增加了卷积过程中的感受野大小。
3.对具体的模型应用场景进行了仔细的分析,提出了一种基于条件随机场模型的语义分割网络——局部区域条件随机场模型,它充分考虑了应用场景与模型之间的适应性,使用新型的算法优化了条件随机场模型的迭代过程,使得模型能够提取到图片像素与像素之间的依赖关系,给分割结果增加了一个平滑的过程,优化了在物体边界区域处的分割结果,并且建立了信息完整、标注尺度统一的交通场景语义分割数据集。
4.为了能够有效利用连续交通场景图片帧与帧之间的强相关信息,本文设计了一种基于卷积神经网络跟踪算法,该算法能够获取图片相邻帧之间的信息,并利用这一信息对相邻帧图片的分割结果进行错误修正。
通过实验证明,本文所述局部区域条件随机场模型能够适时高精度的扩展应用到交通场景图片的语义分割当中。