基于机器视觉的近色背景绿色果实识别研究

来源 :西南大学 | 被引量 : 0次 | 上传用户：meinv123321

【摘要】

：

将机器视觉技术应用于果实产量估计以及果蔬采摘机器人的对象识别,能大幅减少种植管理过程中的人工操作,降低劳动强度,节约用工成本,有助于实现果园管理的自动化、智能化。早

【作者】

：

黄小玉

【出处】

：

西南大学

【发表日期】

：

2004年期

【关键词】

：

机器视觉果实识别特征提取深度学习 YOLOv3

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

将机器视觉技术应用于果实产量估计以及果蔬采摘机器人的对象识别,能大幅减少种植管理过程中的人工操作,降低劳动强度,节约用工成本,有助于实现果园管理的自动化、智能化。早期估产的对象是未成熟的绿色果实,而采摘机器人在整个采摘作业过程中,要解决的主要问题和难点是对果实的自动检测和定位,采摘机器人的作业对象也不乏香梨、青苹果等绿色水果。果实本身呈现绿色,与叶片、杂草颜色相近,自然环境下采集的果实图像存在光照不均、背景复杂、枝叶遮挡,果实重叠等问题,因此,如何实现近色背景下绿色果实的准确识别是一个亟待解决的关键问题。本文以未成熟桃子、番茄、柿子、柑橘为研究对象,分别采用传统特征提取方法和基于卷积神经网络的深度学习方法,提出自然场景下绿色果实的检测方法,并设计了果实识别视觉系统,为果蔬早期估产和后续开发采摘机器人奠定了理论基础和技术支持。论文主要研究工作如下:(1)未成熟绿色果实图像数据集的建立。实地采集桃子、番茄、柿子、柑橘共4种果实的图像,包括顺光、逆光、侧光、遮挡、重叠等场景。为进一步增强数据集的多样性,避免过拟合,采用水平镜像翻转、限制对比度自适应直方图均衡化(contrast limited adaptive histogram equalization,CLAHE)、主成分分析(principal component analysis,PCA Jittering)3种方法进行数据扩增。(2)基于改进DRFI算法的绿色桃子识别。不同于与背景颜色存在明显差异的红色、黄色水果,未成熟绿色桃子的颜色与背景高度相似,单独用颜色特征无法进行区分。提出用绿色桃子特有的颜色、纹理、形状特征代替判别区域特征融合(discriminative regional feature integration,DRFI)算法采用的部分特征,同时对相应的参数进行调整,以更适用于计算未成熟绿色桃子的显著图;采用固定阈值对DRFI显著图进行分割,减少了显著图中背景区域的误分割;针对分割后仍存在的果实相互粘连的情况,通过控制标记符和距离变换相结合的分水岭分割算法将其分割开。试验结果表明:该方法在测试集中的准确识别率为83.2%,误检率为8.7%,漏检率为16.8%,较有效地解决了颜色相近和遮挡重叠问题。(3)基于YOLOv3的绿色果实识别。YOLOv3(you only look once version3)算法利用卷积神经网络提取目标特征后直接进行分类,并预测出图像中目标所在的位置,准确率高、检测速度快。本文以GIoU(generalized intersection over union)损失作为YOLOv3的坐标损失,优化目标的定位结果。在训练时,首先对数据集进行K-means聚类分析,以生成合适尺寸的先验框,其次,运用迁移学习的方法将修改损失函数后的YOLOv3网络模型——YOLOv3-L应用于未成熟绿色桃子、番茄、柿子、柑橘4种果实的识别,并检测算法在不同果园桃子数据集、温室与自然环境番茄数据集上的性能。试验结果表明:在同一桃子图像测试集上,YOLOv3-L的正确识别率为98.0%,误检率为1.0%,漏检率为2.0%,识别效果优于改进DRFI结合分水岭的方法;YOLOv3-L用于检测桃子图像集的平均精度均值(mean average precision,mAP)为92.71%,番茄图像集的mAP为93.98%,柿子图像集的mAP为84.51%,柑橘图像集的m AP为79.00%,表明YOLOv3网络检测精度高,通用性强。不同果园桃子图像集、温室和自然环境番茄图像集试验的结果表明:YOLOv3目标检测网络具有良好的泛化能力;一般来说,样本量更大、多样性更好的数据集训练出来的模型泛化能力越强。(4)果实识别系统设计与实现。为了方便农场种植者、管理者等实际用户的使用,本文通过PyQt5、TensorFlow和OpenCV设计开发了一款近色背景下绿色果实识别软件系统,该可视化系统包括图像载入、模型选择、结果显示,果实数目统计等功能,操作者只需简单点击几个按钮,便能清楚直观地了解到果实识别的情况。

其他文献

个人征信市场化法律对策研究

2018年2月23日,央行发布信息,百行征信有限公司的个人征信业务获得央行许可。这是央行颁发的首张个人征信牌照,标志着国内个人征信行业打破了由政府主导的局面,向更加市场化

学位

个人征信市场化法律对策

基于人体骨架的动作识别

在视频监控系统中,识别人们玩手机、摔倒或打架的动作是必要的。动作识别是人的三维运动信息,在真实的监控视频中快速准确的识别人的动作仍存在很多问题。为了解决这一问题,

学位

动作识别图卷积时间卷积注意力模型人体骨架物体骨架

面向心血管疾病辅助诊断的医学图像分割与分类算法研究

心血管疾病是目前最主要的公共卫生问题,医学图像在心血管疾病的医学临床辅助诊断中有着不可或缺的重要作用。白细胞分类计数作为心血管疾病初步诊查项目中一项意义重大的技

学位

心血管疾病医学图像深度学习白细胞分类心脏MRI分割

面向特定场景的视觉问题生成算法研究

近年来随着深度学习的快速发展,视觉问题生成(VQG)逐渐开始成为一项重要的研究内容,它的任务形式是对于输入的图像给出关于图像内容的一些问题,VQG在多模态对话、幼儿教育以

学位

视觉问题生成注意力机制特定类别问题生成

基于Paillier同态加密的区块链交易隐私保护的应用研究

随着新一代数字货币——比特币的兴起,其底层支撑技术区块链也受到社会的关注,并被认为是信息互联网向价值互联网转换的基石。但是区块链技术体系依赖于全局账本的公开透明化

学位

区块链交易隐私保护Paillier同态加密以太坊

基于Wasserstein自编码器的协同过滤方法研究

目前,我们正经历着从信息时代到数据时代的变迁,运用数据时代大量的信息,可以为我们生活带来许多便利,然而如何去使用这些信息却成了一大难题。而推荐系统则可通过技术手段,

学位

推荐系统协同过滤隐式反馈自编码器链接预测

重形式教学和全形式教学对初中生英语名词数范畴习得影响的实证研究

Long(1988,1991)将“形式聚焦教学”(Form-focused Instruction)分为了“重形式教学”(Focus on Form)和“全形式教学”(Focus on Forms)两种教学方式。他认为在以意义为中心

学位

重形式教学全形式教学英语名词数范畴初中英语教学兴趣和态度

数据驱动的重症患者健康监测方法研究

重症监护室(ICU)主要收治生命危急但有可能挽救的危重病人,集中了医院中最先进的设备和优秀的医护人员,是医院的重要组成部分。病人进入ICU后会进行死亡率预测和健康状态的实

学位

重症监测死亡率预测状态监测即时学习极限学习机主元分析局部加权映射回

区块链的分叉应对和存储策略研究

在区块链技术发展这十年间,区块链已经作为一种核心技术广泛试用于金融、物联网、物流、医疗和保险等多个领域,尤其是在以比特币为代表的数字货币领域,已经获得了很广泛的认

学位

区块链分叉存储限制概率验证节点协同

无人机航拍视频中高精度车辆轨迹提取图像处理方法研究

车辆轨迹数据中包含丰富的交通运行和车辆行驶特性,对于交通流理论分析和建模起到了关键支撑。近年来,无人机航拍成为一种高效、便捷、经济的交通视频采集手段。本研究旨在构

学位

车辆轨迹提取车辆识别与追踪图像处理核相关滤波器(KCF)绝对变换差和(SATD)

基于机器视觉的近色背景绿色果实识别研究

其他学术论文