论文部分内容阅读
服装种类繁多且许多类别之间的差异很小,给高效准确的图片搜索和分析带来了挑战,而通过获取图片标签信息可以帮助解决图片的搜索和分析问题。基于卷积神经网络的图像分类和目标检测技术可以从服装图片中获取标签信息,但是以这种方式获得的标签信息仍然缺乏准确性。本文针对以上问题进行了服装图片的图像分类和目标检测研究。本文主要工作:1)研究并改进了4种卷积神经网络模型对服装图片进行分类。以香港中文大学多媒体实验室发布的DeepFashion数据集为研究对象,训练4种卷积神经网络模型,分别是AlexNet、GoogLeNet、VGG16和VGG19。并根据实验结果和不同模型的特点对模型进行调整,对于AlexNet模型,增加一个卷积层来更好的提取特征并增加模型的表达能力,调整后模型的图像分类准确率有了明显提升;对于VGG19模型,在网络中间增加一个额外的分类器来增强后向传导的梯度信号,训练后模型的图像分类准确率也有了提升,增加的分类器展现出了较好的效果;对于VGG16模型,在网络中增加与第4组卷积层并列的采样层和1×1的卷积层来融合多层特征,调整后的VGG16+Concat模型获得了多组图像分类实验的最好结果。2)基于SSD(Single Shot MultiBox Detector)模型进行服装目标检测实验。首先对数据进行预处理,再使用数据集训练SSD模型;然后在SSD模型中增加多层特征融合的结构再次进行实验;最后对训练方法进行调整,得到了效果较好的目标检测模型。3)测试上文训练得到的模型的实时性和实际应用效果,并选择模型制作可对服装图片进行图像分类和目标检测的应用。首先测试前文训练得到的图像分类模型,获得每种模型的图像处理用时并以此来评价模型的实时性。再制作测试集测试选出的3种图像分类模型在实际应用中的图像分类准确率,根据实时性和实际应用中的图像分类准确率来选择合适的图像分类模型进行应用。然后制作测试集测试SSD模型在实际应用中的图像处理用时并评价模型的实时性。最后应用选出的图像分类模型和SSD模型制作了一个服装图片处理应用。本文使用已有图像识别模型进行服装数据的图像分类和目标检测实验,并调整模型结构和训练方法多次进行实验,分别得到合适的模型和训练方法,最后将模型进行应用。