无人零售环境下数据生成与物体识别算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：marshal

【摘要】

：

近几年来,由于移动支付、深度学习和云计算等技术的快速发展,使得传统零售模式的变革成为可能。在计算机视觉领域中,深度学习算法的研究已成为热门方向之一,其在人脸识别、智

【作者】

：

李东海

【出处】

：

哈尔滨工业大学

【发表日期】

：

2004年期

【关键词】

：

无人智能零售货柜图像分类目标检测显著性物体检测生成对抗网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近几年来,由于移动支付、深度学习和云计算等技术的快速发展,使得传统零售模式的变革成为可能。在计算机视觉领域中,深度学习算法的研究已成为热门方向之一,其在人脸识别、智慧交通、智慧城市等领域得到了广泛地应用。其中,在“无人零售”领域,目标检测和图像分类等深度学习算法发挥着核心作用。当前,无人智能零售货柜作为无人零售商业模式的代表性载体,其在用户体验和实现技术方面与传统的无人零售货柜相比均有较大改善。无人零售货柜的核心问题之一在于如何快速且准确的识别出用户拿取的商品。本文将深度学习用于解决无人零售货柜物体识别问题,为了精准地获取用户拿取商品的信息,分别提出了基于图像分类的动态物体识别方法和基于目标检测的静态物体识别方法。然而,传统分类和对象检测的开源数据集尚未针对无人零售的应用场景进行优化,无法直接进行模型训练。因此,为了利用基于深度学习的分类和目标检测来促进无人零售发展,本文自行搭建实验平台,构建了一个包括34052张图像的无人零售货柜场景的数据集。在此数据集上,训练了主流的图像分类和目标检测模型。针对无人零售货柜场景,设计了Drt Net目标检测模型。其模型的主干网络采用了可变形卷积和组归一化层,损失函数是Focal损失函数和平衡L1损失函数。该模型有效提升了图像检测的召回率。通过实验验证了深度学习模型应用于无人智能零售货柜的可行性。此外,由于在物体识别模型的训练过程中需要大量图像数据,而零售领域的商品种类繁多,给数据的采集和标注带来了极大的挑战性,导致标注数据缺乏。传统方法解决标注数据缺乏,一般采用对已有的图像数据进行翻转、平移、缩放、旋转和随机裁剪等数据增广方法,但此类方法缺乏对新增数据种类的适应性。基于此,本文提出了基于深度学习的显著性物体检测和生成对抗网络的数据生成算法,将其用于自动生成标注数据。算法中使用改进后的Uper Net50网络进行显著性物体检测,采用Cycle GAN进行图像风格迁移。最后,将生成的图像作为目标检测模型的训练集,通过在公开的无人零售数据集RPC上进行测试,测试结果验证了本文算法的有效性。

其他文献

网络语境下的大学语文教学研究

在大学院校中,无论是哪个专业都会涉及到有关语文的学习内容,成为大学中不可或缺的一部分。随着计算机信息化的发展,网络成为人们生活中的重要部分,在这样的环境下出现了网络

会议

网络语境大学语文教学活动

人口规模对于随机扩散率的依赖

本文主要研究在空间非齐性环境下,单一物种的总数量是如何依赖于随机扩散率的.主要研究的方程为Logistic方程.在文章[17]的定理2.4中作者讨论了当?=(0,1),其中a∈(0,1)以及τ

学位

Logistic方程上下解方法Lebesgue控制收敛定理正解的存在唯一性

基于质谱DIA数据处理算法软件评估与肽段定量信号提取算法研究

蛋白质组学(proteomics)试图从质和量两方面,描述不同条件下生物蛋白质的结构与表达。基于质谱(Mass Spectrometry,MS)的定量蛋白质组学是现阶段的一大研究热点。数据依赖采

学位

定量蛋白质组学数据依赖采集数据非依赖采集肽段定量信号提取XICFinder

基因表达关系分析中的关键算法和并行优化技术研究

在基因的表达关系分析中,DNA甲基化和miRNA在基因的特异性表达以及癌症的发生方面发挥着独特的作用。本文分析了当前基因表达关系分析中的关键算法和并行优化问题,并设计和实

学位

全基因组DNA甲基化Smith-Waterman算法天河二号miRNA正向调控随机游走基因表达关系分析

一般型Gorenstein三维代数簇的多重典范次数

代数簇的分类问题是代数几何的一个核心问题.一般型代数簇的多重典范映射的研究对代数簇的双有理分类有着重要意义,本文研究了一般型Gorensein三维复射影代数簇的多重典范映

学位

Gorenstein三维射影代数簇局部终极可分奇点多重典范映射多重典范次数Abel覆盖

基于脑机接口的多移动目标选择技术研究

脑机接口(brain computer interface,BCI)是一种不通过外周神经和肌肉,实现大脑与外界直接通信的新兴技术,已经逐步被应用于多种信息交互和实体设备控制系统中。在许多实际应

学位

脑机接口事件相关电位稳态视觉诱发电位移动目标选择

鸭疫里默氏杆菌HmuY-like蛋白的功能研究

鸭疫里默氏杆菌是一种革兰氏阴性菌,能引起鸭及其他禽类传染性浆膜炎。该菌是一种非常重要的病原菌,阻碍着养殖业的发展。研究表明,鸭疫里默氏杆菌能利用血红素和血红蛋白作

学位

鸭疫里默氏杆菌HmuYRA蛋白铁离子血红素血红蛋白

与术后病理结果对比分析超声诊断对甲状腺乳头状癌诊断的临床意义

目的探究术后病理结果与超声诊断甲状腺乳头状癌的结果对比,以供临床参考以及研究。方法本次研究对象从2013年3月~2016年2月于我院就诊的甲状腺乳头状癌患者中选取67例,对其

会议

术后病理结果超声诊断甲状腺乳头状癌临床意义

中国西北新石器末期到早期青铜时代的双大耳罐谱系研究

本文以公元前2800到1300年左右出土于中国西北地区的双大耳罐为研究对象,其时间跨越了新石器时代末期及早期青铜时代,分布区有我国甘肃、青海东部、宁夏南部、关中西部和陕北

学位

新石器时代末期早期青铜时代双大耳罐谱系文化交流

数形结合思想在初中数学教学中的渗透研究

初中阶段是教育教学工作开展的重要阶段,在这一阶段教学工作中,教学方法往往存在问题,教学工作一筹莫展。这就需要教师通过优化创新,促进教学工作高效开展,通过在教学中应用

会议

初中数学数形结合思想教学现状渗透策略

无人零售环境下数据生成与物体识别算法研究

与本文相关的学术论文