多场景商品图像合成与风格迁移算法研发

来源 :浙江大学 | 被引量 : 0次 | 上传用户:leosky_001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在商品检测与识别任务中,数据的采集与标注非常耗时耗力。商品种类繁多、新旧商品的不断更新换代、不同商品间差异性参差不齐,以及拍摄角度、光照、遮挡等各种不确定性因素的干扰,都给样本采集和人工标注造成了巨大难题。针对这些问题,本文研发了多场景商品图像合成与风格迁移算法,通过该算法生成检测算法所需的训练集,减轻人工标注的负担,具有较高的工程应用价值。本论文首先研发了多场景商品图像合成算法,该算法由单品图像分割和多品图像合成两个模块组成。基于语义分割的单品图像分割算法,采用目前得分最高的DeepLabv3+分割网络,以ResNet 101为特征提取网络,并改进了空洞空间金字塔池化模块。改进后的DeepLabv3+在本文构建的零售商品分割数据集上,mIoU可达到96.77%。在单品分割的基础上研发了面向结算和货架两种场景的多品图像合成算法,优化了商品随机摆放的合成方法、目标框生成策略和融合方法,在PC机上可以达到单进程平均每两秒合成一张结算图或货架图的速度。合成图像与真实图像存在较大的域偏差,为了消除差异性,本文采用改进的CycleGAN对合成图像进行风格迁移。首先对生成器网络的上采样方法进行改进,避免了反卷积带来的棋盘效应,在此基础上设计了两种不同类型的生成器网络结构。针对货架场景的合成图像风格迁移,改进了恒等映射损失并提出了弱监督的训练方式使得训练更加稳定,风格迁移后的图像也更接近真实图像。最后,采用商品检测实验验证合成图像的有效性。针对结算场景,使用FPN作为检测器在合成图像和风格迁移后的图像上训练,cAcc分别达到了 16.87%和47.05%,均超过了现有方法的结果;针对货架场景,采用改进的R-FCN作为检测器,在合成图像中混入少量的真实样本进行训练,mAP50和mAP70分别达到了 94.45%、82.98%,取得与真实样本相当的效果。因此,本文提出的商品图像合成与风格迁移算法能够有效降低人工标注的工作量。
其他文献
大数据及其相关处理技术成为当今计算机科学领域和工业界最重要的技术之一,最为崭新的知识获取范式,商业公司和学术科研组织已经将大数据的获取、存储与处理能力作为其核心竞争力之一。大数据面临着诸多问题,数据的规模正在非线性增长,传统的数据库技术早已不能满足大数据的要求。Google公司于2004年提出的MapReduce框架成为大数据时代具有里程碑意义的技术,然而近年来层出不穷的新场景、新应用却使MapR
21世纪以来经济全球化飞速发展,我国服务业规模不断扩大,已经跃居国民经济第一大产业。随着近年来服务业的发展,服务流程分析与设计成为服务企业优化管理、提高顾客满意度的
四足爬行机器人在斜坡执行任务时需要通过复杂地形,为确保其在斜坡的通过性,需要提高足端控制精度、掌握足端力的大小以及有效地识别地形,所以本文从斜坡下的多步态设计、腿
随着社会水平的快速向前发展和计算机处理水平的提升,现在已进入到数据爆炸的时代。受益于此,计算机视觉衍生出许多的分支,包括人脸检测、图像检索、安全监控、智能汽车、场
在信息化的时代,信息安全成为当今社会很重要的问题,密码学中的加密算法、数字签名和身份认证等等各种方法加强了对秘密的保护,而单单的进行秘密保护是不够的,于是秘密共享的提出为密钥的保护提供了新的思路。随着对秘密共享的不断研究,秘密共享由单秘密共享到多秘密共享,逐步走向成熟和完善。本文对自选子秘密的多秘密共享方案进行研究,多秘密共享是指在一次的秘密共享中就可以实现多个秘密的共享。自选子秘密是防止可信中心
随着工业4.0时代的到来,智能制造的发展和应用极大的促进了人类社会的进步与发展。制造执行系统(MES)是制造业企业在生产车间用于管理和监控工作流程的智能控制系统,它是上层
随着GPU等硬件设备的发展和大型标注数据集的公开,深度学习在计算机视觉领域展现了突出的性能。通过层层堆叠神经元,深度学习构建包含大量可训练参数的深度神经网络模型,并利
注意的空间-数字联合效应(Attention Spatial-Numerical Association of Response Codes Effect,简称注意SNARC效应)是指个体对数字进行较浅的知觉加工时,也能够自动激活相应的空间表征。注意SNARC效应具体表现为当小数作为线索时,被试对左侧目标的反应更快;当大数作为线索时,被试对右侧目标的反应更快。近年来,注意SNARC效应受到越来越多
手指动作识别是实现基于手势的人机交互的关键技术之一,目前主要有两类识别方法,其一是基于视觉传感器的手指动作识别,另一种则是基于运动传感器的手指动作识别。这两种方法
高精度二维角度传感器是三坐标测量机(CMMs)、探头、原子力显微镜和精密加工等仪器的重要组成部分,其测量稳定性是仪器测量精度的重要一环。环境中存在的温度、振动等干扰因