论文部分内容阅读
随着互联网信息技术的迅速发展与服装电子商务时代的到来,网上服装图像数据量急剧增加,用户对服装图像精准分类与高效检索的需求日渐迫切。面对基于文字的图像检索中人工语义标签标注的繁琐性与主观性、基于内容的传统图像特征提取方法中存在的“语义鸿沟”与特征描述片面性等问题,本文基于深度学习方法对服装图像的分类与检索进行了研究。借助卷积神经网络强大的图像特征提取能力,突破了传统方法的局限性,达到了对服装图像的精准分类与高效检索,研究具有社会商业价值与学术意义。本文主要的研究内容如下:1)构建了一个具有30个类别、50万数量级的大规模服装图像数据集。综合DeepFashion、FashionAI、ModaNet等网上公开服装图像数据集的有效图像、**省服装个性化定制协同创新中心项目积累的大量图片及各电子商务网站爬取的服装图像,针对研究任务选取合适图像与分类,得到30个服装类别标签。根据边框标注进行图像分割等基本预处理后,整理形成一个大规模附带服装类别标签的服装图像数据集。2)采用先分类再类内检索的思想,提出了一种融合改进局部敏感哈希算法的服装图像分类检索深度学习模型。主要包括三大模块:ResNet101分类模块、哈希检索模块、分类检索模块:(1)ResNet101分类模块:采用ResNet101神经网络对服装图像特征进行提取,并结合Faster-RCNN网络进行边界框回归提取服装主体,去除背景、多主体等干扰因素后通过Softmax分类器进行服装图像分类,构建起基于深度学习的服装图像分类模型。(2)哈希检索模块:结合服装图像分类模型中的特征提取,在模型后引入哈希层,以Softmax分类器的损失函数反向传播训练哈希函数进行二进制哈希编码,采用结合汉明距离与欧式距离的相似性度量得到的排序结果作为检索结果,构建起基于深度学习的服装图像检索模型。(3)分类检索模块:以先分类再类内检索的思想结合分类模型与检索模型,首先对服装图像数据集进行批量分类与哈希索引库构建,对于一次检索操作,将待检索图像传入模型先分类再接入所在类别下的索引库进行相似性度量,得到这一类别下的相似图像,构建起先分类再类内检索的服装图像分类检索模型。3)对实验结果进行分析,并设计对比实验验证模型性能。实验结果表明,模型整体具有良好的分类准确率、检索性能与稳定性。哈希层的引入加速了检索过程,基于结合汉明距离与欧式距离的相似性度量具有良好的检索效果,图像分割后的数据集对模型具有更高的准确率。相比AlexNet、VGG16、GoogleNet,ResNet101具有更好特征提取效果,先分类再类内检索的思想对服装类别进行了模型修正,在检索速度上具有17.16%提升的同时,达到了对服装领域的针对性,具有重要的研究价值。