论文部分内容阅读
近年来越来越多智能型的建筑中用到了安防、门禁等智能系统,图像语义分割在这些智能系统中的作用是至关重要的,例如安防系统中的目标识别和门禁系统中的人脸识别都用到了图像语义分割。图像语义分割,是把图像分割和图像的识别结合起来,达到把每个像素精确的进行分类的目的的一种技术手段。在航空航天、军事应用、工业制造、医疗诊断、无人驾驶、图像检索到服装搭配也都能够看到图像语义分割的身影。所以,对图像语义分割课题的继续钻研是十分必要的。本文通过阅读大量的国内外学者的文献,对图像语义分割的算法进行了研究。在传统算法和深度学习的算法中,选择了深度学习的算法进行深入的研究。主要用到了全卷积网络和生成对抗网络两种网络模型。本文的主要研究工作有以下两点:(1)把传统图像分割和深度学习的方法相结合,提出了一种叫做SCFCN的新的图像语义分割算法。对全卷积网络中的vgg19进行改进,把传统图像分割中的超像素分割和边缘检测分割加入到vgg19的分割过程中并且引入了高效空间金字塔模块,调整全卷积神经网络的跳跃式结构使得超像素分割和边缘检测分割得到的图像的低级特征和网络输出的高级特征充分融合提取到图像的多尺度特征,最后经过softmax分类器层进行分类得到像素的分类结果。以平均交叠率(MIoU)做为评判标准,平均交叠率比原始的FCN提高了6.9%,在区域准确率上也提升了2.4%。(2)在SCFCN的基础上,提出了一种新的生成对抗网络模型SCAGAN用于图像语义分割。在SCFCN中引入deeplabv2中的空洞空间金字塔池化并改造成编码器-解码器结构做为对抗生成网络的生成模型,设计了包含5个模块的全卷积网络做为判别模型。通过生成网络和判别网络之间的对抗学习来提高模型的分割精度,在数据集Pascalvoc 2012上进行验证,平均交叠率(MIoU)达到了70.10%,跟FCN和SCFCN相比都有所提升。