基于卷积神经网络的服装分类与目标检测研究

来源 :武汉理工大学 | 被引量 : 5次 | 上传用户:forbj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
服装种类繁多且许多类别之间的差异很小,给高效准确的图片搜索和分析带来了挑战,而通过获取图片标签信息可以帮助解决图片的搜索和分析问题。基于卷积神经网络的图像分类和目标检测技术可以从服装图片中获取标签信息,但是以这种方式获得的标签信息仍然缺乏准确性。本文针对以上问题进行了服装图片的图像分类和目标检测研究。本文主要工作:1)研究并改进了4种卷积神经网络模型对服装图片进行分类。以香港中文大学多媒体实验室发布的DeepFashion数据集为研究对象,训练4种卷积神经网络模型,分别是AlexNet、GoogLeNet、VGG16和VGG19。并根据实验结果和不同模型的特点对模型进行调整,对于AlexNet模型,增加一个卷积层来更好的提取特征并增加模型的表达能力,调整后模型的图像分类准确率有了明显提升;对于VGG19模型,在网络中间增加一个额外的分类器来增强后向传导的梯度信号,训练后模型的图像分类准确率也有了提升,增加的分类器展现出了较好的效果;对于VGG16模型,在网络中增加与第4组卷积层并列的采样层和1×1的卷积层来融合多层特征,调整后的VGG16+Concat模型获得了多组图像分类实验的最好结果。2)基于SSD(Single Shot MultiBox Detector)模型进行服装目标检测实验。首先对数据进行预处理,再使用数据集训练SSD模型;然后在SSD模型中增加多层特征融合的结构再次进行实验;最后对训练方法进行调整,得到了效果较好的目标检测模型。3)测试上文训练得到的模型的实时性和实际应用效果,并选择模型制作可对服装图片进行图像分类和目标检测的应用。首先测试前文训练得到的图像分类模型,获得每种模型的图像处理用时并以此来评价模型的实时性。再制作测试集测试选出的3种图像分类模型在实际应用中的图像分类准确率,根据实时性和实际应用中的图像分类准确率来选择合适的图像分类模型进行应用。然后制作测试集测试SSD模型在实际应用中的图像处理用时并评价模型的实时性。最后应用选出的图像分类模型和SSD模型制作了一个服装图片处理应用。本文使用已有图像识别模型进行服装数据的图像分类和目标检测实验,并调整模型结构和训练方法多次进行实验,分别得到合适的模型和训练方法,最后将模型进行应用。
其他文献
随着我国社会主义市场经济的发展,促进了传统产业优化升级。在经济新常态下,给当前财务会计与管理会计发展提出了新的标准和要求。因此,本文就如何在经济新常态下,针对财务会
<正>赵元任(1892—1982)是举世公认的现代语言学大师,被称为"中国语言学之父",百年间罕见的通才、一个"文艺复兴式的智者"。他是中国科学社创始人之一,同时也是天才的作曲家,
期刊
基于目前最优化方法理论教学与实验教学脱节的现状,设计了一套实验课程,包括基本算法和课程项目两大模块,分别覆盖了经典的最速下降法、Newton法、拟Newton法、共轭梯度法、
背景:原发性胆汁性肝硬化(primary biliary cirrhosis,PBC)属于自身免疫性肝病的一种,病理表现主要以进行性的肝内非化脓性小胆管破坏、门静脉炎症为特点,最终可导致肝纤维化
退市难是当今中国证券市场亟待解决的问题。退市机制运行是否顺畅是衡量证券市场成熟度的试金石。本文通过对比中美退市制度及实施效果,发现我国退市制度实施效果不佳,退市制
PLC能够实现高水平的自动化控制,在电气控制线路设计中加强PLC的运用,可以提升电气控制线路的整体控制性能。基于此,本文针对PLC的结构和相关配置进行了简单的分析,然后从步
句调是贯穿整个句子的高低升降的变化.在普通话中句调分为平、升、曲、降四个方面,张家口方言区能熟练运用平、升、降三种句调类别,但由于受方言句调影响在曲调中出现一种独
[目的]通过建立模拟微重力环境,在体外对SD大鼠髁突软骨细胞进行三维培养,探讨模拟微重力环境对软骨细胞生物学特性的影响,为髁突软骨组织工程的种子细胞培养提供研究基础。[
根据模糊三角数的概念构造判断矩阵,据模糊三角数比较大小的原理进行层次单排序;完善交改进了三角模糊数和AHP的理论与方法,最后,介绍了FuzzyAHP在石油勘探区带评价中的一个应用案例。
广西彩调剧目的形成发展大致经历了对子调、江湖调、大调子、传统剧目的整理改编、现代剧目的创编这五个阶段,不同阶段呈现出不同的审美风貌和文化意蕴。早期对子调奠定了彩