论文部分内容阅读
伴随着电子商务的发展,网上购物已经成为一种潮流的购物方式,衣服图像分类和检索也因此具有独特的应用前景,研究价值巨大。面对日益剧增的衣服图像数量,如何快速准确地进行图像分类和检索成为一项很有挑战性和实际意义的研究。同时,由于图像复杂背景的干扰,衣服图像的研究面临着严峻挑战。如何适当地减小背景的干扰,提高图像分类和检索的准确性,已经成为近年来的研究趋势。本文针对衣服图像处理,提出了一种新的属性分类和图像检索方法,主要完成了以下工作:首先,阐述了深度学习的基本理论知识,分析了其工作原理,并研究了相关算法及优化问题。针对衣服图像的部分属性和图像中部分区域有很强的位置对应特性,比如:袖子长度的属性由袖子的区域所决定,提出一种基于衣服图像的属性分类方法。该方法首先结合姿态估计的算法原理,确定图像中和属性相关的部分区域位置;接着利用深度神经网络模型,提取相关区域的局部特征和整幅图像的全局特征;最后融合全局特征和局部特征,作为最后的衣服图像属性的分类特征。同时,将该方法获取的融合特征和图像的单一全局特征进行对比实验,并且设计实验探究不同深度的神经网络模型对该方法的影响。实验表明,将姿态估计应用在属性分类上是很有效的,可以快速且准确地获得相关区域,而且该方法获取的融合特征不管是在哪种神经网络模型中,性能都表现不错。但是,与较浅的神经网络相比,深层的网络会表现得更好,表明该方法中深度神经网络获取的特征同样有益于图像的特征表达。当分类准确的时候,用户就可以根据这些分类好的物品进行检索。对于检索任务,本文提出一种基于衣服区域的图像检索方法。该方法是建立在姿态估计基础上的,根据姿态估计获得的特定区域,确定衣服在图像中的位置,同时引入目标检测算法中的RoI Align算法,获得映射之后的衣服区域特征图,最后将映射后的特征图和整体特征图进行融合,将该融合后的特征作为检索的特征,并且引入在线的triplet loss作为损失函数进行训练。该方法将姿态估计和目标检测算法中的RoI Align理念融入到图像检索中,致力于解决局部区域的确定、局部特征提取以及特征映射问题。最后将该方法和WTB、DARN、RoI Pooling等方法进行实验对比,比较不同网络下的检索性能。实验结果表明,该方法具有高准确率,能够很好地减小背景对图像检索的干扰,能提高图像的检索性能。