论文部分内容阅读
作物模型指用数学概念表达作物生长过程的一系列方法总称,根据建模方法可分为统计模型和模拟模型,统计模型除在作物模型最初发展阶段占据主体之后,模拟模型一直是近几十年来作物模型开发的主流方法。本文首先回顾了自1960年代以来国际和国内作物模型的开发与应用历程,在充分肯定作物统计模型和模拟模型研究巨大成就的基础上,讨论了近十年来在全球气候变化等大尺度区域情境研究中,现有作物模型暴露出模拟效果不理想且操作复杂等问题并分析其原因,在此基础上提出了统计模型在大尺度模拟中仍有其独特优势这一论点。基于这一观点,运用近20年来国际上广受欢迎的支持向量机(SVM),立足于区域模拟这一应用目的,以水稻为研究对象,建立水稻发育期预测和产量预测模型,并进一步整合成基于支持向量机的开放式作物模型(SBOCM)。本文基于建模数据应当尺度兼容这一原则,使用国家气象局公布的全国地面观测台站的逐日气象数据、各台站基本地理信息、中科院1:100万土壤数据库等为基础数据,以全国农业观测台站的水稻发育记录和产量记录为输出,通过设计个“阅读框”实现逐日气象数据的动态导入。变量的筛选通过主成分分析来确定,“阅读框”长度则受限于样本规模仅选取了7日长度(发育模块)和11日长度(产量模块),由于不同耕作制度影响较大,模型分别就单季稻、早稻和晚稻进行建模。SVM训练主要涉及核函数及其超参数确定、惩罚系数优化两个内容。研究中使用K—折交叉验证来完成这一系列训练优化,为三种耕作制度的5个发育期和3个发育节点上的产量预测分别确定最优参数。具体建模过程中,发育模块采用SVM分类(SVC)进行建模,采用不同的负样本生成策略设计了两类样本,K-折交叉验证表明第一类样本具有高敏感度,但在逐日模拟中表现高假阳性,第二类样本则在敏感度和假阳性间取得相对平衡的结果,其对各发育期的K-折交叉验证的Fl值一般在07—0.8之间,逐日动态模拟的误差主要分布在发育期前后5天以内。产量模块采用SVM回归(SVR)进行建模,分别在分蘖期、抽穗期和乳熟期三个发育阶段结束时进行产量预测,结果表明乳熟期时使用抽穗期+乳熟期的变量构成方案效果最佳,三种耕作制度的相对误差分别为18.3%、8.5%、10.2%。文章最后分析了SVM建模过程中存在的问题,并提出了适合大尺度区域模拟的SBOCM系统构建方案,该系统适用于区域尺度下的水稻常年模拟和当年预测,并可在未来进一步整合广泛的社会经济因子提高其预测精度和深化现实意义。