基于实体零售场景的密集目标检测

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:hhgzju1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通用目标检测技术的不断发展,对规范图片的目标检测能力已经大幅提升,然而在很多人为的特定场景中,目标往往是不规律且难以检测的。而这些场景往往更具有工程应用意义,例如对商品紧密排列的货架进行识别可以很大程度减轻商家的货物整理工作量。与此同时在新实体零售业正在崛起的经济背景下,本文也因此受到启发,将研究方向集中于基于实体零售这一特定场景的密集目标检测。通过证明,在这样的密集场景中精确的目标检测仍然是一个具有挑战性的领域,即使是最先进的目标检测器也无法精确定位紧密排列的相同或相似的检测目标。因此,本文提出了一种新的、针对该特定场景的目标检测算法,主要包括以下两方面的工作:(1)设计和实现了一个基于重叠度的Intersection over Union(IOU)子网络,用于抑制密集场景中容易出现的大量重叠的或错误地定位边界框。(2)在加入IOU子网络的模型基础上引入注意力机制,提出了基于混合注意力的密集目标检测算法,深度挖掘图像中的关联信息,使相同或相似的密集目标易于合并或区分,前景与背景更好地分离,从而进一步提高实体零售场景下的密集目标检测效果。本文主要在充分代表了实体零售场景的SKU-110K数据集上,和已有主流的目标检测算法进行了一系列对比实验。实验结果表明,本文提出的基于实体零售场景的密集目标检测算法优于以往模型。在加入IOU子网络与混合注意力模块后,对货架商品的检测效果得到了提升。这些实验结果表明了本文提出模型的有效性。
其他文献
一直以来,农产品质量安全问题都是我国政府和广大民众关注的焦点问题。但是,在我国农产品质量安全治理过程中市场机制不完善、政府规制失效等问题依然较为突出,由于农户不安全生产行为所引发的农产品质量安全事件频繁发生,在以农户个体分散经营为主导的生产模式下,农户的行为偏好更是加深了农户决策行为的复杂性。因此,从行为经济学视角,研究农户行为偏好及政府规制对农产品质量安全监管的影响机理具有重要的理论及现实意义。
图像生成是通过计算机算法去学习源图像与目标图像的映射关系,该技术是计算机视觉中图像内容生成领域的一个重要研究方向。视频作为视觉传输的一个重要载体,它比图片蕴含着更
数字岩心重建方法有很多种,如数值重建、物理实验、混合建模等方法,但这些方法有着训练时间长、实现过程复杂等缺点。生成对抗网络(GANs)作为当前图像生成领域最流行的人工智
巴丹吉林沙漠位于我国境内的西北部,地处内蒙古省阿拉善盟的右旗,与大多数沙漠一样,这里由于气候干旱而降雨量稀少,最终导致了沙漠地区广袤且荒无人烟。但是,在巴丹吉林沙漠腹地却存在着七十多个永久性湖泊,地下水资源也颇为丰富,因而该地区成为水文地质学、气候学以及沙漠学研究的重点区域。近年来,众多学者在巴丹吉林沙漠地区的特殊研究背景下,以其独特的自然地质条件为前提,运用构造学、地球物理学以及地球化学等方法对
固体电解质型的电化学传感器,因其小巧的体积、简单的结构和低廉的成本,成为近年来人们研究的热点。由于电化学传感器的性能很大程度上由敏感电极的性质决定,选择一个合适敏
技术是指通过算法对文本信息高度概括后生成更加精炼、语义通顺的摘要,目的是为了在文本类数据中快速的筛选信息,解决信息冗余过载的问题。当前文本摘要的研究大多集中在传统
当今社会,随着网络技术的不断发展,网络传输能力也不断增强,移动互联网呈现井喷式的发展,基于移动互联网传输音视频数据的应用更是得到了前所未有的发展。其中,特别是利用3G
循环神经网络(Recurrent Neural Networks,RNN)相比于传统的神经网络预测模型,预测速度快、准确度高,但其得到的初始权值和阈值还没有达到最优。因此,文章对RNN进行改进,重点研
烟草是茄科烟草属植物,具有极高的药用价值和经济价值,烟草产业也为我国财政收入做出了巨大贡献。烟草的产量和品质直接影响了其价值。烟草生长至一定阶段,就会由营养生长转变为生殖生长,此时烟草体内大部分的营养物质就会被运输至顶端,叶片、茎、根系生长滞后,而烟草的主要利用价值在于叶片,为了使烟草在栽培中一直进行营养生长,多年来人们探索出来的最有效的也是运用最广泛的方法是打顶,原理是在烟草长出花序后的一段时间
基于位置服务(Location Based Service,LBS)是物联网发展的热点之一。现实生活中,地理位置是人行为活动的重要基础,并且人的活动约有80%时间是在室内进行的。因此,只要能够成