基于卷积神经网络的芒果表皮缺陷检测

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:a7343022
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
芒果表皮缺陷检测是实现芒果的智能化采摘、果实质量分级的重要前提。基于卷积神经网络的计算机视觉技术为缺陷检测提供了可行有效的方法,是目前最为主流的检测方式。在自然环境下,光照的强弱、背景的复杂、果实枝叶茎干的相互遮挡等制约因素下,给芒果表皮缺陷的检测带来了巨大的挑战。采用深度卷积神经网络,可以提取更多的特征,具有更加实时精准的识别效果。因此,本研究采用基于语义分割、实例分割的方法研究自然环境下芒果表皮缺陷的检测。实现更为快速、有效的检测。主要的研究结论及工作如下:(1)芒果表皮缺陷数据集的建立。在自然环境下采集芒果图像并进行人工标注,建立了芒果表皮缺陷数据集。为进一步扩大数据集,采用图像增强的方法,如翻转、镜像、旋转、缩放、提升对比度等方式。为了降低自然环境下图像受遮挡的影响,在预处理阶段进行图像的随机遮挡,增强模型对遮挡目标的识别精度。通过对芒果表皮斑点进行图像形态学处理(闭运算)来消除斑点,降低模型的误检率。(2)基于实时网络LinkNet的分割检测。LinkNet网络具有快速、轻量级、易部署的特点。但较低精度的检测效果不满足实际需求。改进的LinkNet网络结构由原来的ResNet18改为ResNet34,主干模型的第四层网络输出时添加了膨胀卷积操作,膨胀率为[1,2,4,8],且采用的是级联与并行相结合的模式,在原有的基础上增加了每层网络的感受野,对复杂的背景与前景目标以及小物体的准确率上均有提升。改进后的模型在类别平均像素准确率(Mean pixel accuracy,MPA)从71.33%提升到83.73%,平均交并比(Mean intersection over union,MIoU)从69.68%提升到82.42%。(3)基于深度卷积网络DeepLabV3+的分割检测。DeepLabV3+算法具有精度较高、收敛快的特点,但复杂环境下中细小的缺陷识别效果较差,改进的模型采用Atrous-ResNet作为特征提取网络,在编码器模块中添加联合金字塔上采样(Joint pyramid upsampling,JPU)结构,该结构增加模型的多尺度特征及加快模型收敛,同时在解码器模块中融合更多的浅层特征,在测试集上取得了更好的结果。实验结果表明,改进的算法较DeepLabV3+算法的评价指标,类别平均像素准确率从90.69%提升到94.48%,平均交并比从89.56%提升到94.13%。改进的算法结果均优于LinkNet、SegNet算法。(4)基于实例分割Mask R-CNN对芒果表皮缺陷的检测。Mask R-CNN采用目标检测与语义分割相结合的形式。但模型存在较高的误检率与漏检率。改进的模型在原来FPN的基础上,增加了一条侧边连接,使输入和输出在同一层面上,增加特征的多级融合,并采用了一条自底向上的特征融合方式来加强特征提取。改进后模型的芒果类别准确率较改进前模型的准确率提高7.14个百分点,缺陷类别的准确率较改进前的准确率提高6.77个百分点。改进后模型的芒果类别召回率较改进前提高5.75个百分点,缺陷类别的召回率较改进前提高6.49个百分点。
其他文献
三七生长于潮湿、温暖和遮荫等环境下,这类环境容易诱发各类疾病,其发病情况对三七的产量和品质有决定性影响作用,随着种植体量的增大,病害的种类和面积逐年增加。目前,在三七发病率预测方向,研究仍停留在定性描述三七发病率与气象因子关系;在三七叶片病害识别方向,仍依赖于人工主观识别或采用浅层模型进行检测,但这些方法存在预测与识别速度慢、准确率低、泛化性和鲁棒性差等问题,难以高效地掌握三七发病规律,从而不能有
近年来,随着互联网技术的迅速发展,众包模式在各行各业得以应用。众包作为一种面向互联网大众的问题解决机制,聚合大众智慧以更好地解决问题。在众包场景下,众包任务和工人拥有不同需求及意愿,将众包任务分配给与其需求不相符的工人会影响众包任务的完成质量。同时,在众包发包者与工人进行交互的过程中,分配结果可能随着分配双方发现更好的合作对象而有所变更,从而出现无效分配影响分配结果的稳定性。因此,如何有效地将众包
眼底视网膜血管图像作为人体唯一一处不需要侵入性手段就可以获得的血管图像,具有较高的临床价值。眼科以及内科的专家可以根据视网膜血管呈现的不同特征,较为精准的判断多种疾病。然而,在实际的应用中,由于视网膜血管结构复杂以及采样光照和成像设备的影响,常常导致眼底血管图像难以观察,增加了医生的工作难度。因此,研究出一种自动化的高精度视网膜血管分割算法,对于目前的临床辅助诊断非常重要。本文基于深度学习技术对视
供水系统作为城市的基础设施,水质质量直接影响人们的用水安全。在净水厂处理工业中,混凝沉淀是水处理系统的重要工序,决定着水厂出水质量和制水成本,其中混凝剂投加量的控制是关键。由于进入净水厂原水水质地波动,净水厂混凝投药过程存在较大的时滞性,很难及时且精准的计算投药量。因此,对水厂混凝投药系统进行建模,来预测投药量,对保证供水质量安全、降低能耗十分有意义。本研究通过径向基(RBF)神经网络预测模型对水
阿尔茨海默症(Alzheimer’s Disease,AD)是最常见的神经退化疾病之一,严重危害患者的生命健康。核磁共振成像(Magnetic Resonance Imaging,MRI)和正电子发射计算机断层成像(Positron Emission Tomography,PET)可以分别提供大脑的结构与功能信息。国内外最新研究表明,结合同一受试者的MRI和PET图像将有助于提升AD辅助诊断的准确
车联网(Internet of Vehicles,IoVs)是物联网在智能交通领域的重要组成部分,利用车联网技术为车辆提供事故预警消息对于减少或避免次生事故的发生、提高交通安全具有重大意义,是当前车联网应用的研究热点之一。高速公路上由于车辆行驶速度快、车辆位置频繁变化等,导致车间信道条件差、传输不稳定,使得事故预警消息的分发面临严峻挑战。此外,将事故视频作为预警消息进行传播时,能够提供传统文本消息
行人重识别(Person Re-Identification,Re ID)旨在通过非重叠相机采集到的图像中找到与查询图像身份相同的行人,它通常也被认为是图像检索的子问题。近年来随着深度学习的兴起,行人重识别技术在智能监控、安防等领域得到广泛地发展及应用。现有的大多数行人重识别算法都是在同一数据集上进行有监督的训练后再测试,这类算法虽然性能较高,但是极大的限制了其可扩展性。在现实场景中,通常需要将训
海洋资源的开发利用是未来发展的战略重地,因为水下环境恶劣,人们通常借助水下机器人进行海洋探索,通过对水下视频和图像的研究分析,实现海底考古、海洋军事勘察、海洋牧场养殖、海洋环境监测、海洋生物保护等任务。水下拍摄环境复杂恶劣,大量噪声和失真的产生使拍摄的图像质量低下,导致关键特征信息丢失,因此如何获得高质量的水下图像显得尤为重要。为了获取高质量的水下图像,本文针对常见的自然光照下浅海图像和人工补充照
近几年,随着人工智能技术的广泛应用,句法分析等深层自然语言分析的关注度越来越高。句法分析的主要任务是分析一个句子的构成,并使其可以转化成句法树。通过句法分析,可以解析一个句子的构成词块,词与词之间的关系,从而帮助机器理解自然语言,并运用于机器翻译、自动问答、文摘生成等语义理解领域中。句法分析是自然语言处理的一个经典任务,本文主要研究汉语层次句法分析中的边界问题。首先通过剖析短语结构的层次句法分析的
古代石刻文献在我国历史文化研究中向来都是一项不可或缺的研究内容,具有重要的史料价值,但由于自然环境的侵蚀或是人为破坏,石刻文献的表面出现了若干大小不一、分布不均、形状多变的干扰区域,这不仅影响了人们的观感需求,而且对历史研究造成阻碍。信息化时代的来临,可将重要的石刻文献进行数字化储存以延长文物保存时间,也可通过网络共享的方式对石刻文献进行二次传播,打破时间地点的限制,增加古代历史文化的受众面,使用