论文部分内容阅读
随着计算机视觉技术的不断发展,图像分类、图像检测和图像检索的研究成果也不断地被应用到现实生活中。深度学习中的卷积神经网络以其强大的特征提取方式和独特的学习方式,为计算机视觉领域带来了革命性的突破,如何将深度学习方法应用到图像领域已成为新的研究热点。
本文针对“以图搜衣”的传统解决方案不能满足用户高准确度需求的问题,设计了一种从商店时尚服装展示图片中检索街拍时尚服装的方法:首先运用深度学习方法对街拍图像进行目标检测,然后将检测到的各类时尚服装的图像区域作为输入,运行到基于深度学习方法的图像检索算法中,达到时尚服装图像检索的目的。
本文重点研究了以深度学习框架为基础的多种目标检测算法,并针对时尚服装的特点,在 YOLOv2 目标检测算法基础上进行了算法改进,具体工作如下:
1. 针对时尚服装和人体姿势有着紧密联系这一特点,结合人体姿势和关键点位置,对目标检测的区域标框进行先验性判断,提高物体标框的精确性。
2. 为进一步改进YOLOv2算法对细节特征的识别,将更优秀的池化方法S3Pool添加到YOLOv2网络结构中,降低池化时的信息损失,增强提取图像特征时的鲁棒性。
3. 为了提高YOLOv2的训练速率,在YOLOv2网络上添加预训练模型,初始化网络权重,以降低学习时间,且修改了分类损失在YOLOv2损失函数中的占比,提升网络的分类性能。
通过实验证明,基于深度学习的先检测后检索方法有效解决了传统检索方法中图片的复杂背景信息干扰检索精度的问题,能够准确快速地检索出高相似度的时尚服装图像;实验结果显示本文的目标检测优化算法查准率达到89.7%,查全率达到81.2%,高于传统目标检测方法;所应用的深度学习检索算法,mAP达到84.09%,具有良好的检索精度。
本文针对“以图搜衣”的传统解决方案不能满足用户高准确度需求的问题,设计了一种从商店时尚服装展示图片中检索街拍时尚服装的方法:首先运用深度学习方法对街拍图像进行目标检测,然后将检测到的各类时尚服装的图像区域作为输入,运行到基于深度学习方法的图像检索算法中,达到时尚服装图像检索的目的。
本文重点研究了以深度学习框架为基础的多种目标检测算法,并针对时尚服装的特点,在 YOLOv2 目标检测算法基础上进行了算法改进,具体工作如下:
1. 针对时尚服装和人体姿势有着紧密联系这一特点,结合人体姿势和关键点位置,对目标检测的区域标框进行先验性判断,提高物体标框的精确性。
2. 为进一步改进YOLOv2算法对细节特征的识别,将更优秀的池化方法S3Pool添加到YOLOv2网络结构中,降低池化时的信息损失,增强提取图像特征时的鲁棒性。
3. 为了提高YOLOv2的训练速率,在YOLOv2网络上添加预训练模型,初始化网络权重,以降低学习时间,且修改了分类损失在YOLOv2损失函数中的占比,提升网络的分类性能。
通过实验证明,基于深度学习的先检测后检索方法有效解决了传统检索方法中图片的复杂背景信息干扰检索精度的问题,能够准确快速地检索出高相似度的时尚服装图像;实验结果显示本文的目标检测优化算法查准率达到89.7%,查全率达到81.2%,高于传统目标检测方法;所应用的深度学习检索算法,mAP达到84.09%,具有良好的检索精度。