基于神经网络和3D视觉的果园苹果识别与定位的研究

来源 :北京交通大学 | 被引量 : 4次 | 上传用户:wusuowei282736
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国在果蔬种植方面具有很强的竞争力,但根据中国果业的发展特点和趋势,仍有一些亟待解决的问题,其中,水果采摘是整个行业中耗时最长,资金投入最多的步骤之一。目前中国的采摘工艺大部分是由人力资源完成的,然而随着人口老龄化和生产成本增加等问题的产生,迫切需要将基于人工智能的自动化技术广泛引入到果蔬采摘中。本论文对于采摘过程中果园苹果的识别和定位两个核心步骤进行了深入研究,完成的主要工作及得出的结论如下:(1)利用基于神经网络的目标检测网络进行苹果的识别。深入研究了 SSD(Single Shot Multibox Detector)算法原理,指出由于分类任务和定位任务的侧重点不同,所需要的特征性质也是不同的。针对这个问题,本文对SSD的网络结构进行改进,提出了 FSF-SSD(Feature-separate-fuse SSD)算法,在一定程度上将类别预测和位置预测两个任务分离,并对位置预测任务的特征图采用特征融合操作,结合上层语义信息和低层外观特征,使其获得更多的定位与细节信息。(2)利用双目立体视觉理论,在识别苹果的基础上定位其空间位置。论文在深入研究3D视觉理论基础上,设计一种与FSF-SSD算法相结合的立体匹配算法。算法依次计算待匹配图像中回归框与参照图像中各个回归框的IoU(Intersection over Union,交并比),得到在参照图像中与待匹配图像IoU最大的回归框序号,若两次得到的最大IoU回归框的序号相同,则匹配成功。在成功匹配的基础上利用视差法进行了苹果的定位并得到苹果中心点的三维坐标,从而为机械臂的抓取提供数据支持。(3)基于以上研究,本文进行了实验验证。对于果园苹果的识别,FSF-SSD算法的平均检测精度为95.25%,在SSD基础上提升了 2.31%。为了证明模型的迁移能力,本文还在Pascal VOC 2007公开数据集进行了验证,平均检测精度为74.92%,在SSD基础上提升了 1.03%。对于苹果定位环节,本文首先进行了匹配算法的验证工作,分析实验结果可以得出,对于遮挡较少的密集场景的匹配准确率达到97.8%,对于有部分遮挡的场景匹配准确率达到96.8%。最后在成功匹配的基础上进行视差法定位实验,分析实验结果可以得出,基于中心点坐标匹配的视差定位法精度可以满足机械臂的误差要求。至此,对果园苹果完成了精确识别、立体匹配和空间定位,这一全新的采摘方案为机械臂抓取提供了算法基础和数据支持,应用前景十分广阔。
其他文献
营销渠道的建设直接影响公司整体业绩。当前,随着新一轮的行业重组以及3G牌照的发放,使得中国移动、中国联通、中国电信三家运营商均成为全业务运营商,实力趋于接近,提供的业
随着我国经济的高速发展和高速公路路网的不断完善,人们通过高速公路的出行变得越来越方便快捷。高速公路已经融入到了许多人的日常生活中。随着生活水平的提高,人们对高速公
随着大跨径桥梁的发展,钢箱梁斜拉桥应用越来越广泛。在钢箱梁斜拉桥的设计施工过程中,温度参数的影响是不可忽略的因素。因为温度影响,造成钢箱梁斜拉桥施工的实际状态与设
改革开放带来了人们消费观念的改变,"即时消费"、"超前消费"日趋流行,这都为企业的市场营销提供了新的契机。企业要在当前激烈的市场竞争中生存和发展壮大,分期付款是一个行
城市河道治理工程的主要任务是河道堤防设计,堤防工程是满足河道行洪的基本措施,是提高洪水承载能力、改善城区河道生态环境的,建立平面上和立体空间上城市文化的载体,城市堤
汽车整车热管理是从热量角度统筹动力系统(发动机、电机、电池)与整车的关系,采用综合手段来平衡各个系统的热量传递和相互影响,使各个系统在各自最佳温度范围内工作,进而优
沥青路面裂缝检测是交通信息工程和模式识别领域的一项挑战性的工作。论文以长安大学"CT-501A”高速激光道路检测车采集的图像数据为基础,通过对沥青路面裂缝类病害图像特性
信息技术的进步和发展已改变用户思维方式和分析深度,通过交互获取用户认知信息成为信息服务中的重要问题。围绕网络环境中的用户认知问题,分析信息技术对用户认知活动的影响
物业管理为人们带来整洁、有序、便利的生活环境和优美、清新、舒适的工作环境以及物业的增值、保值的效果,改变了人们"无偿使用,无偿受益"的观念,也确定了物业管理的经营属
购买净水器.首先要认识净水器最重要的组成部分一滤芯,滤芯相当于净水器的心脏起搏器.滤芯是净水器起到各种净水作用的最重要的配件。