基于MSR-CNN的果蔬检测与识别算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:wanglx199085
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国是果蔬进出口大国,由于世界各国的地理位置和气候的不同,各国之间的果蔬种类差异化非常明显,果蔬差异会影响我国的果蔬进出口交易;此外,超市中果蔬的零售过程仍然采取人工称重的方式,浪费人力并且效率低下,严重影响顾客的购物体验。针对这些情况,本文提出了一种基于Mask Scoring R-CNN的果蔬检测与识别算法,能够实现果蔬检测、识别与分割等任务,该算法未来不仅可以用于移动端进行果蔬检测与科普,还可以实现果蔬的智能称量。本文的研究内容和贡献如下:(1)本文构建了一个包含多种日常水果蔬菜的果蔬图像数据集,并且命名为Veg F,适用于果蔬检测、识别与分割等任务。Veg F总共包含了36000张果蔬图像,总共36种果蔬类别,其中水果24类,蔬菜12类,不仅包含了每种类别的单个目标图像,还有同类别的多目标图像以及多类别的混合图像,充分考虑了目标检测与识别中可能会出现的情况。目前国内外并没有适用于果蔬检测与识别的果蔬图像数据集,Veg F数据集的出现,有助于日后果蔬检测与识别算法的研究。(2)针对特征金字塔网络存在的问题,本文采用Aug FPN结构,缩小特征之间的语义差异,使其更适合后续的特征融合,并利用残差增强的方式减少特征在金字塔最高层通道中的信息损失。实验结果表明,在COCO 2017数据集中,Aug FPN能够使Mask Scoring R-CNN的APbbox提高1.6个百分点,APmask提高1.3个百分点;在果蔬数据集中,APbbox提高了1.4个百分点,APmask提高了0.7个百分点。(3)本文在Mask Scoring R-CNN的基础上,提出了MS-Io U R-CNN结构,该结构引入了box Io U分支,以在预测框和相应的真实框之间预测Io U;其次,由于RPN生成的训练样本数量不足且Io U分布不平衡,本文在每个边界框中添加可控制的抖动,以获取足够多的Io U分布均衡的训练样本;此外,本文采用预测Io U和分类置信度的乘积作为非极大值抑制算法的边界框排名依据,从而保留定位更准确的边界框,实现更精确的目标定位。实验证明,在COCO 2017数据集中,MS-Io U R-CNN模型与MS R-CNN模型相比,APbbox提高了1.2个百分点,APmask提高了0.8个百分点;在果蔬数据集中,APbbox提高了1.9个百分点,APmask提高了1.5个百分点。(4)本文采用轻量卷积神经网络的思路,提出了DSC-MS R-CNN和SGS-MS R-CNN两种压缩模型。与本文提出的MS-Io U R-CNN+Aug FPN模型相比,DSC-MS R-CNN模型的运行时间减少78ms,占用内存下降417MB;SGS-MS R-CNN模型的运行时间减少92ms,占用内存下降545MB。本文的压缩模型比原有模型节省了至少54.0%的内存空间,使本文的果蔬检测与识别算法具有更高的实用价值。
其他文献
向量优化理论是优化理论和应用的主要研究领域之一,它是基于多目标优化问题的应用背景在最近几十年迅速发展起来的一个新兴的运筹学分支,其研究范畴包括向量值和集值最优化问题
21世纪以前,费马、Baker、Pocklington、Brown、J.H.E.Cohn、张明志和李德勋等人解决了当|k|≤100时,不定方程x~4+kx~2y~2+y~4=z~2只有平凡解的情况.本文旨在解决当100≤|k|≤3
新世纪以来,中国特色社会主义进入新的时代,习近平总书记表示:“人民对美好生活的需要日益广泛,不仅对物质文化生活提出了更高要求,而且在民主、法治、公平、正义、安全、环境等方面的要求日益增长。”1这也表明了精神文明建设的迫切性以及国家对社会整体公平正义的重视。公共图书馆服务是我国精神文明建设的重要内容,其服务是否均等影响着社会整体的公平和正义。加强公共图书馆服务均等化的建设,有利于保障公民的基本文化权
生化系统的多目标优化问题是近年来研究的一个热门课题,许多专家和学者都做出了卓有成效的工作。在实际的优化问题当中,我们要考虑的目标不止一个,而是两个或者多个。通常情况下
Banach压缩映象是一类有着广泛实际背景的典型而且重要的非线性映射,人们在各种空间里面,不断的提出新的压缩映像,构造不同的迭代序列。在对参数的一定限制条件下,讨论各类压缩映
聚合物驱油技术成熟、成本低,在国内外陆上油田得到了广泛应用。但海上油田原油粘度高、剪切能力强、地层水矿化度高,常规线性聚合物难以满足在海上油田注聚条件下的增粘能力
本论文采用超快光谱技术分别对一种光致异构化分子和量子点的发光性质以及电子转移特性的过程展开了详细的研究。随着超短脉冲技术的迅速发展,研究者发现通过此项技术可以获得
随着科技与工业的快速发展,材料制备技术的要求也逐步提高,电流辅助烧结技术应运而生。电流辅助烧结是采用交流或直流脉冲大电流通过粉体实现快速烧结和致密化的工艺。相比于
新一轮工业革命带动着信息时代的发展,人们对于信息传输的需求不断增加,技术革命带来的新型产业对于集成化的要求也越来越高,随着元器件尺度的不断缩小,集成电路中结构的复杂程度也显著提升,此时电互联面临着种种局限,如延迟高、带宽小和信号干扰大等,硅基光电子学利用光信号作为新的传输媒介,发挥其高宽带、高传输效率和高抗干扰性等特点,成为集成电路领域新的研究热点。硅基光源作为硅基光电子学的重要组成部分一直以来受
图像实例分割问题在计算机视觉领域中担当重要的角色。随着深度学习技术的迅速发展,基于深度神经网络的强监督实例分割技术已经取得了显著的进展。为了降低强监督实例分割技术对于高成本像素级人工标注的依赖性,基于弱监督学习的实例分割技术研究也逐渐引起了研究者的关注。为此,本文以人体目标为例,采用基于深度学习技术的分割框架,展开弱监督实例分割技术的相关研究。具体研究工作及成果如下:(1)采用差分进化的PRM实例