论文部分内容阅读
作为大数据重要组成部分的农业大数据,是大数据理念、技术以及方法在农业领域的应用和发展。基于多年农作物病虫害发生期作物生长发育状况、气象条件、周边环境、土壤特点和农事管理措施等数据,利用大数据的理念、技术及分析方法,针对病虫害的发生趋势和程度进行监测预警,使数据转化为监测预警的行动,是大数据思想的具体体现,也是未来的发展趋势。玉米螟属鳞翅目(Lepidoptera),螟蛾科(Pyralidae),是世界玉米生产的主要害虫之一。在我国已知有亚洲玉米螟Ostrinia furnacalis(Guenée)和欧洲玉米螟Ostrinia nubilalis(Hübner)2种,其中,亚洲玉米螟是优势种,在我国玉米主产区发生2-3代,以第二代为主害代。玉米螟以其幼虫蛀食玉米心叶、茎秆和果穗,造成玉米风折、早枯及缺粒等现象。这不仅影响玉米的品质,而且也会造成玉米产量的严重损失。本文依据山东省二代玉米螟发生期气象因子的整体数据,基于SPSS和R语言2种数据分析软件,分别组建了多元线性回归模型、主成分回归模型和多项式回归模型,用于玉米螟的发生程度预测,主要结论如下:(1)通过对山东省滨州地区2003-2013年的平均气温、降水、日照时数、风速等气象资料的相关分析,采用多元线性回归方法,分析预测6月下旬、7月上、中、下旬和8月上旬,玉米螟的发生程度,建立了玉米螟动态气候预测模型。经检验,玉米螟的发生与当地的平均水汽压、平均相对湿度、最大风速、平局风速、降水量和日照时数等气象条件关联度高,6月下旬、7月上旬、7月下旬和8月上旬模型拟合的准确率分别为91%、77%、69%和68%。(2)使用R语言作为数据分析平台,首先以主成分分析方法,从影响玉米螟发生的16个气象因子中确定了9个主成分,再以这9个主成分作为自变量,在主成分的基础上,建立了山东省二代玉米螟发生程度的主成分多元回归模型,Multiple R-squared为0.437。(3)仍以R语言为数据分析平台,建立了山东省二代玉米螟发生程度的多项式回归模型,Multiple R-squared为0.5012。两类模型的验证结果显示:非线性的主成分分析方法在筛选影响因子时,最后选择的9个主成分的贡献率达到99.36%,确实比相关性分析得到的影响因子更准确、全面、稳定。经过验证,主成分多元回归模型的解释能力较弱,模型参考意义不强;多项式回归模型解释能力有所提升,对模型有一定解释能力,在农业害虫玉米螟的预测预报中有一定效果。