论文部分内容阅读
近几年来,由于移动支付、深度学习和云计算等技术的快速发展,使得传统零售模式的变革成为可能。在计算机视觉领域中,深度学习算法的研究已成为热门方向之一,其在人脸识别、智慧交通、智慧城市等领域得到了广泛地应用。其中,在“无人零售”领域,目标检测和图像分类等深度学习算法发挥着核心作用。当前,无人智能零售货柜作为无人零售商业模式的代表性载体,其在用户体验和实现技术方面与传统的无人零售货柜相比均有较大改善。无人零售货柜的核心问题之一在于如何快速且准确的识别出用户拿取的商品。本文将深度学习用于解决无人零售货柜物体识别问题,为了精准地获取用户拿取商品的信息,分别提出了基于图像分类的动态物体识别方法和基于目标检测的静态物体识别方法。然而,传统分类和对象检测的开源数据集尚未针对无人零售的应用场景进行优化,无法直接进行模型训练。因此,为了利用基于深度学习的分类和目标检测来促进无人零售发展,本文自行搭建实验平台,构建了一个包括34052张图像的无人零售货柜场景的数据集。在此数据集上,训练了主流的图像分类和目标检测模型。针对无人零售货柜场景,设计了Drt Net目标检测模型。其模型的主干网络采用了可变形卷积和组归一化层,损失函数是Focal损失函数和平衡L1损失函数。该模型有效提升了图像检测的召回率。通过实验验证了深度学习模型应用于无人智能零售货柜的可行性。此外,由于在物体识别模型的训练过程中需要大量图像数据,而零售领域的商品种类繁多,给数据的采集和标注带来了极大的挑战性,导致标注数据缺乏。传统方法解决标注数据缺乏,一般采用对已有的图像数据进行翻转、平移、缩放、旋转和随机裁剪等数据增广方法,但此类方法缺乏对新增数据种类的适应性。基于此,本文提出了基于深度学习的显著性物体检测和生成对抗网络的数据生成算法,将其用于自动生成标注数据。算法中使用改进后的Uper Net50网络进行显著性物体检测,采用Cycle GAN进行图像风格迁移。最后,将生成的图像作为目标检测模型的训练集,通过在公开的无人零售数据集RPC上进行测试,测试结果验证了本文算法的有效性。