基于机器视觉的近色背景绿色果实识别研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:meinv123321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将机器视觉技术应用于果实产量估计以及果蔬采摘机器人的对象识别,能大幅减少种植管理过程中的人工操作,降低劳动强度,节约用工成本,有助于实现果园管理的自动化、智能化。早期估产的对象是未成熟的绿色果实,而采摘机器人在整个采摘作业过程中,要解决的主要问题和难点是对果实的自动检测和定位,采摘机器人的作业对象也不乏香梨、青苹果等绿色水果。果实本身呈现绿色,与叶片、杂草颜色相近,自然环境下采集的果实图像存在光照不均、背景复杂、枝叶遮挡,果实重叠等问题,因此,如何实现近色背景下绿色果实的准确识别是一个亟待解决的关键问题。本文以未成熟桃子、番茄、柿子、柑橘为研究对象,分别采用传统特征提取方法和基于卷积神经网络的深度学习方法,提出自然场景下绿色果实的检测方法,并设计了果实识别视觉系统,为果蔬早期估产和后续开发采摘机器人奠定了理论基础和技术支持。论文主要研究工作如下:(1)未成熟绿色果实图像数据集的建立。实地采集桃子、番茄、柿子、柑橘共4种果实的图像,包括顺光、逆光、侧光、遮挡、重叠等场景。为进一步增强数据集的多样性,避免过拟合,采用水平镜像翻转、限制对比度自适应直方图均衡化(contrast limited adaptive histogram equalization,CLAHE)、主成分分析(principal component analysis,PCA Jittering)3种方法进行数据扩增。(2)基于改进DRFI算法的绿色桃子识别。不同于与背景颜色存在明显差异的红色、黄色水果,未成熟绿色桃子的颜色与背景高度相似,单独用颜色特征无法进行区分。提出用绿色桃子特有的颜色、纹理、形状特征代替判别区域特征融合(discriminative regional feature integration,DRFI)算法采用的部分特征,同时对相应的参数进行调整,以更适用于计算未成熟绿色桃子的显著图;采用固定阈值对DRFI显著图进行分割,减少了显著图中背景区域的误分割;针对分割后仍存在的果实相互粘连的情况,通过控制标记符和距离变换相结合的分水岭分割算法将其分割开。试验结果表明:该方法在测试集中的准确识别率为83.2%,误检率为8.7%,漏检率为16.8%,较有效地解决了颜色相近和遮挡重叠问题。(3)基于YOLOv3的绿色果实识别。YOLOv3(you only look once version3)算法利用卷积神经网络提取目标特征后直接进行分类,并预测出图像中目标所在的位置,准确率高、检测速度快。本文以GIoU(generalized intersection over union)损失作为YOLOv3的坐标损失,优化目标的定位结果。在训练时,首先对数据集进行K-means聚类分析,以生成合适尺寸的先验框,其次,运用迁移学习的方法将修改损失函数后的YOLOv3网络模型——YOLOv3-L应用于未成熟绿色桃子、番茄、柿子、柑橘4种果实的识别,并检测算法在不同果园桃子数据集、温室与自然环境番茄数据集上的性能。试验结果表明:在同一桃子图像测试集上,YOLOv3-L的正确识别率为98.0%,误检率为1.0%,漏检率为2.0%,识别效果优于改进DRFI结合分水岭的方法;YOLOv3-L用于检测桃子图像集的平均精度均值(mean average precision,mAP)为92.71%,番茄图像集的mAP为93.98%,柿子图像集的mAP为84.51%,柑橘图像集的m AP为79.00%,表明YOLOv3网络检测精度高,通用性强。不同果园桃子图像集、温室和自然环境番茄图像集试验的结果表明:YOLOv3目标检测网络具有良好的泛化能力;一般来说,样本量更大、多样性更好的数据集训练出来的模型泛化能力越强。(4)果实识别系统设计与实现。为了方便农场种植者、管理者等实际用户的使用,本文通过PyQt5、TensorFlow和OpenCV设计开发了一款近色背景下绿色果实识别软件系统,该可视化系统包括图像载入、模型选择、结果显示,果实数目统计等功能,操作者只需简单点击几个按钮,便能清楚直观地了解到果实识别的情况。
其他文献
2018年2月23日,央行发布信息,百行征信有限公司的个人征信业务获得央行许可。这是央行颁发的首张个人征信牌照,标志着国内个人征信行业打破了由政府主导的局面,向更加市场化
在视频监控系统中,识别人们玩手机、摔倒或打架的动作是必要的。动作识别是人的三维运动信息,在真实的监控视频中快速准确的识别人的动作仍存在很多问题。为了解决这一问题,
心血管疾病是目前最主要的公共卫生问题,医学图像在心血管疾病的医学临床辅助诊断中有着不可或缺的重要作用。白细胞分类计数作为心血管疾病初步诊查项目中一项意义重大的技
近年来随着深度学习的快速发展,视觉问题生成(VQG)逐渐开始成为一项重要的研究内容,它的任务形式是对于输入的图像给出关于图像内容的一些问题,VQG在多模态对话、幼儿教育以
随着新一代数字货币——比特币的兴起,其底层支撑技术区块链也受到社会的关注,并被认为是信息互联网向价值互联网转换的基石。但是区块链技术体系依赖于全局账本的公开透明化
目前,我们正经历着从信息时代到数据时代的变迁,运用数据时代大量的信息,可以为我们生活带来许多便利,然而如何去使用这些信息却成了一大难题。而推荐系统则可通过技术手段,
Long(1988,1991)将“形式聚焦教学”(Form-focused Instruction)分为了“重形式教学”(Focus on Form)和“全形式教学”(Focus on Forms)两种教学方式。他认为在以意义为中心
重症监护室(ICU)主要收治生命危急但有可能挽救的危重病人,集中了医院中最先进的设备和优秀的医护人员,是医院的重要组成部分。病人进入ICU后会进行死亡率预测和健康状态的实
在区块链技术发展这十年间,区块链已经作为一种核心技术广泛试用于金融、物联网、物流、医疗和保险等多个领域,尤其是在以比特币为代表的数字货币领域,已经获得了很广泛的认
车辆轨迹数据中包含丰富的交通运行和车辆行驶特性,对于交通流理论分析和建模起到了关键支撑。近年来,无人机航拍成为一种高效、便捷、经济的交通视频采集手段。本研究旨在构