基于卷积神经网络的果园水果检测算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:fjnu_lhx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景下的水果检测在自动机械收获系统、水果产量统计与预测等方面具有较大的应用前景。但是,果园现场环境十分复杂,存在着遮挡、光照不均匀、水果颜色与周围环境颜色相近等问题,导致依靠传统手工设计特征的机器学习方法检测准确率不高,泛化性能不强。由于基于深度学习的目标检测算法检测准确率高,泛化能力强,并且对于遮挡和光照不均匀等问题具有较强的鲁棒性。因此,本文利用卷积神经网络进行水果检测,分别研究了使用锚点框的算法和不使用锚点框的算法,成功实现了高准确率的水果检测。本文的主要贡献有:1)针对使用锚点框的一阶段算法对小尺寸水果定位困难和检出率较低的问题,研究了使用锚点框的二阶段基于区域提议的网络Faster R-CNN,并对其进行优化改进,提出了基于区域提议网络的水果检测算法(Fruit Detection R-CNN,FD R-CNN)。FD R-CNN算法使用Res2NetPlus进行特征提取,结合K-means聚类分析和统计的标注框宽高分布确定了适合本文所用数据集的锚点框尺寸。利用双线性插值获得特征图上不同尺寸候选区域中浮点坐标位置处的特征值。在分类层边框回归时,综合考虑了预测框与标注框的交并比、中心点距离和长宽比,使得边框回归变得更加稳定。2)针对使用锚点框的二阶段算法网络结构复杂,速度慢的问题,研究了网络结构简单的非锚点框算法,并提出了基于Res2NetPlus的水果中心点和尺寸预测(Fruit Center and Size Prediction based Res2NetPlus,FCSP-Res2NetPlus)算法。FCSP-Res2NetPlus算法使用Res2NetPlus进行特征提取,并分别利用转置卷积、最近邻插值和双线性插值进行上采样,最终使用预测模块直接预测出水果的中心点和尺寸。3)在芒果和杏数据集上对前述方法进行了实验验证。其中,FD R-CNN算法在芒果和杏数据集上的平均准确率分别达到了0.975和0.979。FCSP-Res2NetPlus算法中,在特征提取网络中使用最近邻插值模块进行上采样的网络获得了最优的结果,在芒果和杏数据集上的平均准确率达到了0.980和0.973。实验结果表明,本文提出的FD R-CNN和FCSP-Res2NetPlus都能够有效提升小尺寸水果的检测准确率,能够更好的适应复杂背景下的水果检测,具有较强的鲁棒性和泛化能力。并且FCSP-Res2NetPlus能够更快速的完成水果检测工作,很好的平衡了检测速度和准确率。
其他文献
随着市场经济的飞速发展,夫妻作为重要的经济主体,参与各类经济活动,夫妻共同债务纠纷日益增多。处理有关夫妻共同债务纠纷所暴露出来的问题也愈加明显。夫妻共同债务问题无
REST接口规范具有一致性与统一性的特点,只需要提供一套接口就可以无差别的为Web、Android与iOS应用提供服务。而SSM框架作为Java开发中的主流框架之一,因其配置简单、层次功能分离受到广大后端开发者的喜爱。但是,在软件开发过程中,数据访问的相关操作的代码具有很大的相似性,并且跨越了持久层、业务层和控制器层等多个层次,开发人员首先需要定义REST接口,然后需要花费大量时间来编写和维护数据
在物流运输快速发展的今天,加强对无车承运的监管能力是保证我国物流秩序安全稳定的重要基础。由于无车承运体系参与角色复杂且空间覆盖极广,客观上增加了监管的难度。随着日益成熟的信息技术手段,对无车承运过程中的安全监管与风险管控多采用传统理念的手段,且无车承运流程的执行周期较长,参运方往往不能快速接收承运任务,在降低信息透明度的同时抑制承运体系的发展。因此有必要开发无车承运系统解决上述问题。无车承运系统的
随着深度学习的广泛普及以及移动端硬件性能的提升,将深度学习和神经网络技术引入移动设备提升用户体验已经成为必然趋势。考虑移动设备移动性强和便携的特点,分布式训练深度学习模型要减少任务的执行时延和设备的电量消耗。为了提升训练速度和保障训练过程中的隐私安全,目前已经有一些项目利用区块链开展移动设备的分布式训练,其中移动设备进行并行的分布式训练大大缩短了训练模型所需的时间,区块链网络记录了分布式训练的流程
哺乳动物的肠道拥有复杂而动态的肠道菌群,在维持宿主免疫和代谢稳态以及抵抗病原体方面起着至关重要的作用。近年来人们逐渐认识到饮食在调节肠道菌群的组成和代谢活性中的作用,并进一步对宿主健康产生影响。补充膳食多糖被认为是维持健康的肠道菌群组成的最佳方法。膳食多糖能够抵抗宿主消化酶的降解,被定植于肠道的微生物利用,从而选择性地改变肠道微生物的组成和代谢活性,进而产生对宿主有利的影响。不同的膳食多糖由于结构
教育实习是高校体育教育专业必不可少的重要环节。随着“教育部关于大力推进师范生实习支教工作的意见”、“教育部关于大力推进教师教育课程改革的意见”、“教育部关于加强师范生教育实践的意见”等相关文件的出台,说明了高校学生是未来教师的主要来源,而高校的体育教育实习这一环节也是培养未来中小学体育教师的重要手段之一,是将所学到的知识再次得到印证和被认可的一个过程,并通过教育实习评价对学生实习过程中的教学、管理
农村旱厕改造是提高农村人居环境治理效果的重要环节,农村厕所卫生水平是关系广大农村群众生活福祉、决胜全面小康社会的决定性因素,更是乡村振兴提质增效的关键组成。虽然各地的农村旱厕改造工作取得了一定成效,但是在推进过程中仍存在一些较难解决的问题,需要经过相关调查和研究发现问题,分析问题并寻找到解决问题的对策,为持续推进农村旱厕改造供参考和指导。本文通过查阅文献的方法梳理国内外厕所革命的研究现状,收集淄博
实时精确列车测速定位对列车运行控制具有重要意义,近年来,北斗(Bei Dou Navigation Satellite System,BDS)、GPS(Global Positioning System)等全球导航卫星系统(Global Navigation Satellite System,GNSS)在铁路列车定位中的应用已成为一种重要发展趋势。卫星定位性能受信号观测条件直接影响,当列车进入或通
输出误差类系统可以分为线性输出误差系统和非线性输出误差系统,因为其具有简单结构、灵活多变的特点而受到广泛的关注,并应用于工程实践中。递推最小二乘算法、随机梯度算法都是解决线性输出误差系统的经典辨识算法,递推最小二乘算法精度高、收敛快,随机梯度算法计算量小。本文的研究主要针对线性输出误差系统、非线性输出误差系统以及带有量化器的线性输出误差系统,主要工作如下:针对线性输出误差系统,结合随机梯度算法计算
在通信系统中,射频功率放大器是主要的非线性与能量消耗源头。因此作为通信系统中的必要部件,射频功率放大器的性能关系到通信系统的传输质量。由于功率放大器在保证高效率运行时,其输入输出信号非线性失真严重,因此需要采取数字预失真技术使功率放大器的输入输出信号线性化。本文对基于Volterra级数模型的直接学习结构和神经网络结构进行了深入研究,主要创新工作如下:1.对负反馈结构进行深入研究,提出了负反馈结构