随机森林及数据可视化在棉蚜等级预测中的应用研究

来源 :山东农业大学 | 被引量 : 0次 | 上传用户:pigdun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
棉蚜的监测预警是对棉蚜提前防治的研究重点,采集棉蚜发生相关的数据进行分析预测,提前对棉蚜进行防治,减少棉蚜给棉花带来的危害,实现棉区的高产和优产。进行数据分析的研究过程从两方面展开:一是利用高性能的机器算法;二是从数据可视化的角度对数据进行展示分析。本文首先利用随机森林算法进行了棉蚜的数据分析。随机森林是由多棵决策树构成的集成分类机器学习算法,多用来进行数据的分类预测。决策树和多元线性回归算法也同随机森林一样常用来做数据的预测。但是算法的不同,可能导致在同一数据集上的预测率不一致,所以本文对三种算法在UCI数据集和粘虫数据集上进行了准确率对比的实验。目前进行棉蚜虫害等级预测多用的线性回归模型,线性回归模型的缺点是采用何种因子进行表达只是一种猜测,以至于影响了因子的多样性和不可测性。随机森林模型的构建不会因为影响因子的表达有所影响,况且随机森林算法不会产生过拟合,处理大样本集时速度快,对于多元共线性不敏感,分类预测的准确率较高。本文的对比实验中表明了随机森林在数据预测中准确率高,后期的实验采用随机森算法在棉蚜等级预测中进行应用。棉花是我国重要的经济作物,在农业经济格局中作用巨大。而棉蚜是造成棉花减产和影响优产的主要因素,因此棉蚜的提前防治非常重要。本文在对采集到的数据进行数据的不平衡性处理和影响因子的筛选之后,构建基于气象因子数据和棉蚜天敌数据的随机森林模型,并利用构建好的模型对棉蚜虫害发生的等级进行预测。本实验表明随机森林模型的泛化误差较小,在棉蚜虫害等级预测中的准确率比较高。其次利用数据可视化技术进行数据分析。数据可视化技术作为数据分析的重要手段,用于棉蚜数据、气象数据的分析中为棉蚜的防治提供参考。多维数据可视化作为数据可视化的研究重点之一,通过对多维数据进行展示,发现属性之间联系。目前我们采集的数据为多维数据,将采集到的气象数据和棉蚜数据进行可视化展示,发现数据隐藏的规律信息,有助于更好的进行数据分析与决策。本论文中数据的展示与分析使得对棉蚜的大发生时间有了了解,为我们在合适的时间进行防治提供参考,实验中数据的可视化为模型的构建和实验结果的展示与分析起到了重要作用。
其他文献
本文分析了圆球法测量止端螺纹环规中径的接触状态,指导出判断球测头与螺纹牙侧是否产生非相切接触的判别式,并给出了误差计算公式。
<正>一、我国夫妻财产制度《婚姻法》第17、18、19条分别对夫妻共有财产、夫妻一方的财产、夫妻财产约定做了规定。从其对夫妻财产的规定来看,既有法定制,也有约定制,而约定
当前机械加工中测量技术发展趋势是,从计量室向生产车间转移,产品质量保证的责任全部落实到生产班组。因此测量仪器在硬件和软件方面均经历着重大变革。简要介绍了高精度量值
本文介绍了美国和日本研制的两种新型非接触式齿轮测量仪。因为非接触式测头是非接触式量仪的关键技术所在,所以着重阐述了光学式测头的工作原理。 This article describes
网络技术的发展不仅改变了当下的企业发展格局,在企业的经营模式上也有了较大的改变。在便利的网络环境下,消费者通过网络对产品进行深入化的了解,此外消费者之间还可以共同
<正>一、介绍熊彼特把创新定义为在组织中引入新的要素或者对旧要素的重新组合(Schumpeter, 1934)。随着知识经济的到来,特别是在高科技行业里,创新的能力已经成为企业潜在的
会议
本文概述了陶瓷刀具材料的类型,并通过对新陶瓷刀具材料Al_2O_3+TiC+Si_3N_4的切削试验表明,其切削性能介于Al_2O_3+TiC与Si_3N_4二者之间,但成本较低,对工件材料适应性较强,
精益管理源于精益生产,是企业通过持续不断地提高产品质量、持续不断地降低成本、持续不断地提高交货速度来应对短缺时代以及竞争不断激烈的市场环境的先进管理模式。在优质
<正> 布良斯克机械制造厂开发了一种曲轴轴颈车刀(原苏联发明证书号:1484446),这种车刀只用切向进给方式工作,其切削刃对被加工工件倾斜成ψ角,切削刃的长度l=B/tgψ式中B—
针对红外微波复合探测的目标识别问题,提出了基于关联信息的多传感器复合探测目标识别方法,通过红外与微波传感器对真实探测目标和虚假干扰目标的回波差异分析,采用关联信息