基于目标检测的快消品识别研究与应用

来源 :湖南大学 | 被引量 : 0次 | 上传用户:robin3000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域中一个非常重要、活跃的研究课题,同时也是一项应用广泛的技术,例如智能导航、航空航天、无人驾驶、无人商店等。随着最近几年深度学习的发展,目标识别无论是在理论研究方面还是应用开发方面,都获得了飞速的发展。但目标识别的准确率依然受到目标小、目标数量多、遮挡、样本数量等因素干扰。因此,如何克服这些因素的负面影响,提高识别率和识别速度是目标识别研究者们面临的巨大挑战。本文提出了一种密集连接的残差网络。Faster R-CNN的基础网络用来提取输入图片的基础特征,随后用于目标的分类和定位,由于卷积网络随着网络层数的增加,提取的特征越来越抽象,不利于目标的定位。残差网络常用于Faster R-CNN框架的基础网络,残差网络的每一个块都能提取到一个特征图,且抽象级别依此增加。为了利用残差网络的每一个特征图,将残差网络的每一个块相互连接起来,连接的方式为:每一个块的输入是它前面所有块的输出,而每一个块的输出都会传递给它后面的块。通过这样的连接方式,每一个块都能直接从损失函数获得梯度,从第一个块获得输入,这种连接方式进一步减轻了梯度消失的问题。同时,由于对特征进行了充分的混合,对于分类问题,分类器可以利用到所有的特征来进行分类,使得分类效果更好,而对于目标检测问题,特征中包含了位置信息,使得目标的定位更加精确。将Faster R-CNN的基础网络替换为密集连接残差网络,可以增加Faster R-CNN的性能。本文在分类数据集CIFAR-10、CIFAR-100上对本文提出的网络结构进行了测试,该网络结构取得了非常好的成绩,同时改进的Faster R-CNN算法在VOC2007数据集上也有取得了不错的成绩。本文将改进的Faster R-CNN目标检测框架应用到快消品识别系统中。目前市场中存在大量品牌的啤酒,啤酒厂家每天都需要对市场上啤酒的销售情况进行分析统计以做出决策。以前的人工方式不仅容易出错而且非常耗时。快消品识别系统能够自动的识别图片中的啤酒并给出每个品牌啤酒的数量。该系统采用了模糊判断和倾斜判断的算法来对图片进行预处理,采用了多模型融合的方法来提高识别准确率。在货架场景中训练出了单罐模型和连包模型,在地堆场景中训练了大标签模型和小标签模型。在识别后处理中对330ML和500ML两种型号啤酒进行了误识别自动纠正。在Faster R-CNN训练阶段,对anchor的生成做了特殊的设置,根据啤酒瓶的宽高比和大小设定anchor的参数。在预测阶段,使用了Tensorflow Serving进行模型管理,使用Flask框架提供WebService服务,整个系统可以分布式运行。
其他文献
伴随着中国社会的现代化进程,中国公路电影成为近年来炙手可热的电影样式.面对现代化带来的压力、焦虑与矛盾,中国公路电影承担着弥合创伤、稀释焦虑、放飞心灵、抚慰情感的
期刊
孤独幽香的心灵之花谈《我的秘密之花》傅郁辰当一位电影导演成名之后,人们除了给予他更多的关注及殷切的希望之外,还会以十分严格的尺度去衡量他的新作,有时甚至会苛求。佩德罗
探讨不同血糖水平对综合ICU危重症合并应激性高血糖患者的影响。ICU术后患者和内科危重患者即使无糖尿病史,在应激情况下常出现高血糖,易引起严重感染、多发性神经病变、心肌
<正>[教材内容分析内容与地位]在《普通高中物理课程标准》共同必修模块物理1中,涉及本节内容要求如下:理解牛顿第三定律,用牛顿运动定律解释生活中的有关问题。牛顿第一、第
以湖南大学为例,从开放性大学的特点及其问题入手,通过对"TOD"模式的深入研究,分析了"TOD"在开放性大学校园规划中应用的可能性、优势以及挑战。提出了相应的发展策略及措施
现实经济生活中,未注册商标不断产生并占据了商标总量的一大部分。基于这个事实,我们应当给予未注册商标以必要的法律保护。分析未注册商标与注册商标的法律保护政策的不同之
中国朝鲜族是在朝汉双语双文化基础上学习英语,因此在他们的英语学习过程中会出现朝鲜语和汉语的双重迁移。朝汉双语人完全有条件调动已掌握的两种语言的知识系统,进行英朝、英
为了研究空气源跨临界CO2热泵系统中影响最优排气压力的主要因素,以跨临界CO2热泵机组为平台,在焓差室中进行了制热性能测试。结果表明,系统的蒸发压力和气冷器出口温度随排
本文针对我国企业开拓国际市场的现状和企业自身的弱点,分析并阐述了加强国际水电工程研究的必要性和紧迫性。分析了项目管理和风险管理的本质,得出项目管理实质上就是项目风