论文部分内容阅读
近年来,人工智能技术推动了社会快速发展。越来越多智能化产品给人们的生活带来巨大的便利,其中就包括大型超市中一系列智能化服务设备,提高了顾客的购物体验,同时也为超市带来一定的收益。然而,超市中智能化设备仍然不够健全,例如给散装蔬菜称重的电子秤,依然需要人工手动输入蔬菜的单价,导致效率较低。因此,为了提高超市的运行效率和改善顾客的购物体验,智能化称重设备显得至关重要。超市散装蔬菜智能化称重设备需要准确地对蔬菜目标进行检测,同时完成称重和计价功能,从而给顾客带来较大的便利,解决排队烦恼。其中,智能化称重设备的蔬菜检测功能是最重要的部分。当前的目标检测算法主要包括传统的机器学习方法和深度学习方法。与传统的机器学习方法相比,深度学习方法在计算机视觉方面表现尤为突出,因此本文基于深度学习的目标检测方法实现对蔬菜快速检测。本文主要包括以下内容:由于国内外公开的蔬菜数据集还不存在,所以需要自己从超市和互联网中收集蔬菜图片,并从大量的蔬菜图片中筛选出有效的数据。在本文中蔬菜图片总计7632张,共有20个类别,并且都是超市内常见的蔬菜。然后,使用标注工具将蔬菜图片标注成PASCAL VOC数据格式用于模型训练。由于传统目标检测方法鲁棒性低,本文在两阶段目标检测方法中选择性能良好的Faster RCNN算法用于检测蔬菜目标。为了提高蔬菜目标检测的精度,实验基于Faster RCNN算法进行了优化。首先,利用Res2Net-50提高网络的多尺度表达能力;其次,采用自上而下和自下而上结构将高低层特征相互融合,使得用于检测的每层特征图均包含丰富的上下文信息;然后,通过Soft-NMS方法解决蔬菜目标密集摆放导致召回率差的问题;最后,使用数据增强扩大样本量提升模型的泛化能力。最终,改进后的Faster RCNN算法检测蔬菜目标的平均精度m AP达到94.6%,检测速度每秒8帧。与两阶段目标检测方法相比较,一阶段目标检测方法拥有更快的检测速度。为了能够实时精确地检测蔬菜目标,本文采用了YOLOv3算法。由于YOLOv3是针对公开数据集优化的算法,为了适应于检测蔬菜,本文对该算法进行了改进。蔬菜目标的尺度与PASCAL VOC数据集相比具有一定的差异,本文将Dense Block结构添加到Dark Net-53网络中构造出了深层卷积神经网络。另外,MSE算法作为YOLOv3的边框回归损失函数,对目标的定位精度相对较差,本文提出DIo U作为YOLOv3的边框回归损失函数用于提高目标的定位精度。最后,利用K-means方法获取适应于蔬菜数据集的先验框。改进型YOLOv3算法在蔬菜数据集上测试,m AP达到了93.2%,检测速度为每秒35帧,满足了实时检测要求。在改进型YOLOv3的基础上,本文搭建了超市散装蔬菜智能化称重打码设备,经过测试,该设备表现出较好的检测性能。