基于深度学习的采摘机器人水果识别定位与采后自动分级技术研究

来源 :天津理工大学 | 被引量 : 0次 | 上传用户:xiaohw123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
果实采摘机器人和水果分拣机可实现采摘工作和分拣工作的自动化,能够很好的解决水果产业劳动力不足、人工作业成本高且效率低、果品竞争力差等问题。研发采摘机器人和分拣机的重点和难点在视觉系统,它们的工作效率和稳定性取决于其对果实识别的速度和准确率,因此,研究能够在果园复杂环境下精确检测定位树上果实以及能够在分拣生产线环境下分类不同外观品质果实的视觉系统,对实现自动采摘、产量估计以及自动分拣具有重要研究价值和现实意义。本文以苹果为研究对象,基于深度学习和双目视觉技术,对采后果实自动分级技术以及采摘机器人果实检测定位技术进行了研究。主要研究工作与成果如下:1.果实检测方法研究。为使采摘机器人能够全天候的在不同光照、重叠遮挡、大视场等果园复杂环境下对不同成熟度的果实进行快速、准确的识别,该研究提出了一种基于改进YOLOv3的果实识别方法。首先,将Dark Net53网络中的残差模块与CSPNet(Cross Stage Paritial Network)结合,在保持检测精度的同时,降低网络的计算量;其次,在原始YOLOv3模型的检测网络中加入SPP(Spatial Pyramid Pooling)模块,将果实的全局和局部特征进行融合,提高对极小果实目标的召回率;同时,采用Soft NMS(Soft Non-Maximum Suppression)算法取代传统NMS(Non-Maximum Suppression)算法,增强对重叠遮挡果实的识别能力;最后,采用基于Focal Loss和CIo U Loss的联合损失函数,对模型进行优化,提高识别精度。以苹果为例进行的试验结果表明:经过数据集训练之后的改进模型,在测试集下的MAP(Mean Average Precision)值达到96.3%,较原模型提高了3.8个百分点;F1值达到91.8%,较原模型提高了3.8个百分点;在GPU下的平均检测速度达到27.8帧/s,较原模型提高了5.6帧/s。与Faster RCNN、RetinaNet等几种目前先进的检测方法进行比较并在不同数目、不同光照情况下的对比试验结果表明,该方法具有极高的检测精度及优秀的鲁棒性和实时性,在果园环境下解决果实的精准识别问题具有重要实用价值。2.果实三维定位方法研究。在利用目标检测算法得到果实采摘中心点的二维坐标之后,为了进一步获得果实采摘点的深度信息,使用了双目立体视觉技术,使用张氏标定法标定双目相机,确定其数学模型,对采集到的图像进行立体校正,并将校正后的左目图像和右目图像利用SGBM立体匹配算法进行立体匹配,最终通过视差计算获取果实采摘中心点的三维坐标。试验结果表明:利用该视觉系统获得的三维坐标,在深度方向上的平均定位误差为±15mm,满足实际采摘需求。3.果品分类方法研究。为了实现对采摘后的果实进行快速、精确的外观品质分类,并配合分拣生产线完成果实大规模集中分拣,该研究提出了一种基于改进ResNet的果实分类方法。首先,将ResNet网络中的残差模块与双通道SE(Squeeze-and-Excitation)模块结合,增强有效的通道特征并抑制低效或无效的通道特征,提高特征图的表达能力,从而提升识别精度;其次,在原始ResNet模型中加入Inception模块,将果实不同尺度的特征进行融合,增强对较小缺陷的识别能力;最后,对收集到的4类不同外观品质的果实图像进行数据增强并利用迁移学习方法对模型进行初始化。以苹果为例进行的试验结果表明:经过数据集训练之后的改进模型,在测试集下的准确率达到99.7%,高于原模型的98.5%;精确率达到99.7%,高于原模型的98.3%;召回率达到99.7%,高于原模型的98.7%;在GPU下的平均检测速度达到32.3帧/s,与原模型基本持平。与GoogleNet、MobileNet等几种目前先进的分类方法进行比较并对不同改进模型进行对比试验的结果表明,该方法具有优异的分类精度及良好的鲁棒性和实时性,对解决果实外观品质的精准分级问题具有重要实用价值。4.果实检测定位与分类系统软件设计与实现。基于PyQt5和Qt Designer设计了果园复杂环境下苹果采摘机器人苹果检测与定位软件及自动分拣生产线环境下苹果外观品质分类软件,实现了苹果的精准检测定位和外观品质分类。
其他文献
在当今全球经济飞速发展的背景之下,国际间的贸易往来日益增加,海上交通也愈发复杂。海洋中船舶数量的增加以及水域交通越发的复杂,海事部门对于船舶的监管的力度也随之更加严格,因此加强海上交通的管理变得十分的重要。本文将数量庞大的AIS海事数据进行解析和存储,并通过挖掘和分析大量的数据,获得特定海域内的船舶运动密集区域,为未来的海上航道构建、船舶路径规划提供辅助的依据与帮助,并通过AIS数据识别可能存在异
近年来,光纤传感器由于其高灵敏度,抗腐蚀性,抗电磁干扰等特性而受到广泛的关注。马赫-曾德尔干涉仪(MZI)传感器由于其高灵敏度和简单的结构而应用于各个传感领域。越来越多的新型结构如偏芯,弯曲,涂敷,腐蚀,打锥等的MZI传感器被用来测量温度、湿度、折射率、液位、应变等不同参量。无芯光纤(NCF)是一种没有纤芯的特种光纤,在传感实验中以自身包层为纤芯,外界环境作为包层而进行传感过程以此来获得较高灵敏度
由于多缸液压机具有较强的非线性、过驱动特性及偏载导致的非同步性,使得多缸液压机的建模复杂,控制器设计困难。因而目前对多缸液压机控制策略的深入研究较少,控制系统的性能仍亟待完善。本论文针对上述问题,围绕五缸液压机的控制方法展开了以下工作。首先将多缸液压机活动横梁的动力学方程组提炼为一般的二阶非线性微分方程组。在此基础上,提出了一种新型边界层超螺旋滑模控制策略,并给出了稳定性分析方法。然后将该控制策略
生物质作为绿色可再生资源,众多高附加价值化学品都可从中获得,甚至包括生物燃料,对于改善自然环境、部分替代化石能源和对人类的可持续发展等都具有重大的意义。糠醛(FF)作为具有十分重要潜力的生物质衍生物,可通过加氢或加氢脱氧处理升级,得到生物燃料及许多其它高附加价值的化学品。传统的热催化转化过程,通常需要高温高压,此外产物选择性不易控制。然而电催化转化的过程,条件温和,质子替代氢气,且可简单的通过调节
在大气中红外制导飞行器高速飞行,由于头部会与来流之间发生剧烈的压缩、摩擦等作用,从而产生复杂的湍流流场。这些复杂的湍流流场会产生气动光学效应,使光学系统接收到的目标图像发生气动光学成像偏移,这将会影响飞行器的精确瞄准,严重影响制导的精度。在气动光学的研究中,对气动光学效应的分析和预测,已经成为了现代飞行器重要的研究任务之一。在本文中,首先对气动光学效应的研究背景及意义进行了分析,较详细的阐述了近些
3~5μm和8~12μm的中远红外激光在分子光谱、遥感、自由通信和环境监测等工业和民用领域具有重要的应用价值。利用非线性光学晶体的频率转换技术,如:光参量振荡、光参量放大等,是固体激光器产生中远红外相干光的有效途径。本论文以设计合成新型中远红外非线性光学晶体为目标,通过将氧化物和硫属化合物结合,设计、合成4种具有非中心对称结构且能表现非线性光学效应的氧硫属化合物新晶体。并获得了它们的小尺寸单晶,通
老年痴呆以及下肢瘫痪病人往往存在不同程度尿失禁的问题。如何通过便携体外设备对上述患者膀胱尿量进行有效感知与检测,指导患者如厕将有助于提高患者监护质量和生活质量。因此,本文研究设计开发了一种便携式超声膀胱尿量检测装置,用于准确测量人体膀胱尿量,利用移动端软件将尿量信息进行显示。主要研究内容如下:1.设计了基于超声波的硬件采集装置用于提取膀胱尿量信息。超声波发射电路激励超声波探头生成超声,并将超声波探
虚拟城市是虚拟现实技术应用于城市规划和设计方面的重要手段,而街区内自动建筑布局在虚拟城市的仿真生成中是体现其真实性和沉浸感的重要过程。想要达到较好的布局效果,通常需要建筑设计师花费大量精力,经过反复试错和探索去设计布局方案。本文从自动建筑布局的两个部分入手,在形成街区内建筑的初始布局阶段,提出了一种使用较少相关数据就可以生成符合约束且较为合理的街区建筑布局的方法;在街区内建筑布局优化阶段,在使用遗
交流继电器是保障色灯信号机正常工作的重要电气设备。依照《铁路技术管理规程》的相关规定,需要每月对点灯单元内的继电器进行一次检修。目前,主要由工人现场拆下送至检测部门进行检测,存在操作复杂、周期长等问题。本课题结合嵌入式系统和物联网技术,研制了一套铁路色灯信号机交流灯丝转换继电器时间参数在线检测系统。该系统包括远程控制、实时检测、数据远程传输、云端处理、及时报警等诸多功能,具有在线检测、集成度高、速
脑机接口技术(Brain-Computer Interface,BCI)可通过控制医疗器械、智能轮椅、机械手臂等外部设备表达人脑活动信号,从而达到恢复肢体能力的目的。但由于目前多数BCI技术仍处于试验阶段,很多算法结果并不理想,同时由于外部设备价格昂贵、连接复杂、人工智能算法耗费大,脑电信号识别精度得不到保证,因此采用虚拟人进行算法研究具有重要意义。为此,本文研究了运动想象脑电信号识别控制虚拟人技