基于Fisher判别分析算法的县域耕地地力等级预测

来源 :安徽农业科学 | 被引量 : 0次 | 上传用户:chenfurongyalan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要 [目的]借用機器学习算法——判别分析算法来简化耕地地力评价工作,探索区域尺度上机器学习方法在地力评价应用的新途径。[方法]基于辉县市测土配方施肥财政补贴项目耕地地力评价工作获取的基础数据,依据我国农业部标准《耕地地力调查与质量评价技术规程》(NY/T 1634—2008)和该市耕地地力评价实践经验,选取研究区表层土壤质地、土壤剖面特征、地表砾石度、速效钾、有效磷、有机质含量、灌溉保证率、排涝能力、地貌类型、坡度等10个土壤和立地条件因素作为耕地地力水平的判别变量,构建Fisher典则判别函数模型,对5 922个评价单元的耕地地力状况进行判断分析和归类分级。[结果]经对判别结果进行统计验证和回代验证,显示预测判别正确率高达91.4%。[结论]在耕地地力评价与分级标准确定的前提下,判别分析算法在区域尺度上对分析耕地地力状况、预测耕地地力等级方面具有独特优势。
  关键词 耕地地力;耕地地力评价;判别分析;典则判别函数
  中图分类号 S158 文献标识码 A 文章编号 0517-6611(2017)25-0199-04
  Abstract [Objective]To simplify the evaluation of cultivated land fertility by applying the machine learning algorithm, which aims to explore a new approach to the application of machine learning method in the evaluation work of cultivated land fertility at regional scale.[Method] Based on Technical Specification for Investigation and Quality Evaluation of Cultivated Land Fertility (NY/T 1634—2008) and the local practices of cultivated land evaluation, the methods applied by this study generally are supposed to use the based data obtained by the financial subsidy project for soil testing and formulated fertilization conducted in Huixian City, Henan Province, to establish canonical discriminate functions. 10 soil and site condition factors including surface soil texture, soil profile characteristics, surface gravel degree, rapidly available potassium in soil, available phosphorous in soil, organic matter content in soil, irrigation guarantee rate, capacity for drainage, geomorphic types, and surface slope are selected as the discriminant variables of cultivated land fertility level. By constructing the model of Fisher discriminant functions, Fisher discriminant analysis (FDA) was employed to determine, analyzed and classified land fertility in 5 922 sampled sites of the studied region using that Fisher discriminate functions. [Result]The results of the methods demonstrate a prediction accuracy reaching up 91.4% after mathematical statistics verification and back substitution verification which means the original data being returned back to the Fisher discriminant functions. [Conclusion]Under the premise of identifying the standard of evaluation and classification of cultivated land, the discriminant analysis algorithm has a unique advantage in analyzing and classifying the fertility situation of cultivated land and predicting the grade of cultivated land.
  Key words Cultivated land fertility;Evaluation of cultivated land fertility;Discriminant analysis;Canonical discriminate functions   耕地是农业生产活动中最重要的生产资料,是农业生产可持续的基础[1],耕地地力是评价耕地质量的一个综合指标[2],是耕地内在自然属性和人类干预活动交互作用下的现实生产能力表现,耕地地力水平直接影响着作物生长发育、农产品产量和质量[3]。河南省是传统的农业大省,是我国最重要的粮食主产区之一,肩负着保障国家粮食安全的重要使命。为实现《国家粮食核心区建设规划》《河南省高标准粮田“百千万”工程建设规划》提出的战略目标,全省正坚持以耕地质量建设为核心,依靠科技进步,全面实施耕地质量提升综合技术措施,改善耕地土壤理化性状,提高耕地综合生产能力,强化抗御自然灾害的能力,保护农业生态环境。各项耕地质量培育、综合地力提升技术措施的顺利、高效实施,离不开对耕地生产力现状的全面了解、準确评价以及对耕地地力等级的科学划分和空间分布格局的全面掌握。
  判别分析(Discriminate Analysis,DA)是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法,其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大样本数据确定判别函数中的待定系数,并计算判别指标,据此确定特定样本的类型归属[4-6]。判别分析是一种在实践中应用较为广泛的机器学习算法[7]。实际应用中,判别分析有多种形式:根据判别式处理变量的方法不同,可以分为逐步判别、序贯判别等;根据判别标准不同,可以分为距离判别、Bayes判别、Fisher判别法等[8]。
  Fisher判别分析(Fisher Discriminant Analysis,FDA)亦称典则判别,是根据线性Fisher函数值进行判别,其基本思路就是投影,针对P维空间中的某点x=(x1,x2,…,xp),寻找一个能使它降为一维数值的线性函数y(x)=Cjxj,然后应用这个线性函数把P维空间中的已知类别总体以及求知类别归属的样本都变换为一维数据,再根据其间的亲疏程度把未知归属的样本点判定其归属。投影的原则是使得每一类的差异尽可能小,而不同类间投影的离差尽可能大。判别函数主要有两种,即线性判别函数(Linear Discriminant Function)和典则判别函数(Canonical Discriminate Function)。其中,构建线性判别函数的基本前提是各类样本相互对立、且符合正态分布;而典则判别函数是建立在方差分析思想上,可较好地区分出各个总体,而不对总体分布做任何要求[9-10]。我国农业行业标准(NY/T 1634—2008)中规定的耕地地力评价方法——综合指数法在我国耕地地力评价与分级实践中的应用最为广泛,根据计算出的每一评价单元的耕地地力指数,采用耕地地力指数累积曲线法划分耕地地力等级。该方法对软件要求较高,且步骤复杂繁琐。在国内一些案例研究中,支持向量机(Support Vector Machine,SVM)算法、模糊支持决策算法以及分类与回归树算法等机器学习、决策分析等领域内的新技术被用于耕地地力评价,而判别分析算法自问世以来,在国内矿藏评估、风险预警、财务分析、交通规划、疾病诊断、智能识别等领域应用广泛,但鲜有学者将其应用于耕地地力等级划分。笔者将Fisher判别分析算法引入耕地地力分级实践中,通过县域案例研究,探索区域尺度上机器学习技术在耕地质量评价、耕地地力分级以及中低产田划分应用的新途径。
  1 数据来源与研究方法
  1.1 研究区概况
  河南省辉县市(新乡市代管的县级市)地处河南省西北部,地理坐标为35°17′~35°50′E、113°20′~113°57′N。辉县市属暖温带大陆性季风气候,总面积2 007 km2,区域内西部为太行山脉,山地面积1 007 km2,平原面积783 km2,丘陵217 km2。截至2005年末,全市耕地面积5.34万hm2。根据第二次全国土壤普查结果,全市共分布潮土、风沙土、褐土、砂姜黑土、水稻土、沼泽土和棕壤等7个土类、13个亚类的土壤[11]。
  2.2 数据来源
  研究区主要数据源为河南省辉县市测土配方施肥补贴项目及其耕地地力评价专项获取的表层土壤属性数据以及相关立地环境数据、二调土地利用现状数据库、最新修订的土壤图、地形图等相关图件资料等。在已经完成的辉县市耕地地力评价实践中,选取表层土壤质地(x1)、土壤剖面特征(x2)、地表砾石度(x3)、速效钾(x4)、有效磷(x5)、有机质含量(x6)、灌溉保证率(x7)、排涝能力(x8)、地貌类型(x9)、坡度(x10)等10个对案例地区耕地生产性能影响较大、区域内的变异明显、且在时间序列上具有相对稳定性、与农业生产关系密切的因素作为耕地地力评价因素,据此将案例地区耕地从高到低划分为4个等级(表1)[12-14]。
  2.3 研究方法
  判别分析的基本原理是按照一定的判别准则,建立一个或多个判别函数,Fisher判别法的优势在于对分布、方差等都没有任何限制,应用范围比较广。其判别的核心思想是投影,需要选择一个投影方向,使得同一类的样点沿这个方向能最大程度地集中,不同类的样点能较好地区分出来,同时保证组间均方差与组内均方差之比最大[15-16]。这就需要建立一个判别函数,其线性表达式可写为:
  3 判别分析结果与检验
  3.1 研究区耕地判别分析结果
  根据农业部标准《耕地地力调查与质量评价技术规程》(NY/T 1634—2008)和辉县市测土配方施肥财政补贴项目耕地地力评价实践,采用表层土壤质地、土壤剖面特征等10个土壤和立地条件因素作为耕地地力状态的判别变量,通过构建Fisher判别函数,对辉县市5 922个样点的耕地地力状况进行判断分析和归类分级。
  按照组内离差小、组间离差大的原则分析样点数据,建立判别函数,判别函数是在已知观测样本的分类和特征变量值的前提下,基于那些蕴涵信息丰富、最大程度描述各类间关系的变量构建的判别函数,参与分析的观测量共分为m个总体,则建立n(n  表3中,检验的原假设为各组变量均值相等,Wilks’Lambda是组内平方和与总平方和的比,检验判别函数的显著性水平,值域在0~1,值越小表示组间有很大的差异,值接近1表示没有组间差异;卡方是Lambda的卡方转换,用于确定其显著性;Sig.小于0.05,表明3个判别函数均具有统计学上的意义。
  从表4可以看出,第1判别函数方差所占比例为96.6%,说明其可以解释样品96.6%信息,仅利用此函数即可完成对绝大部分样点的判别,当利用第1判别函数无法对样点所属类别做出明确判断时,辅以第2甚至第3判别函数来解释所有样本的信息。以第1、第2典则判别函数为坐标轴建立联合分布图(图1)。
  图1是根据第1和第2典则判别函数做出的散点图,图上显示,4个类别很显著地彼此区别开。研究区样点各变量数据代入第1和第2典则判别函数中,以第1判别函数值为横坐标,第2判别函数值为纵坐标,观察样本点落入的区域,即为预测出的耕地地力等级。经统计计算,这些事先已知等级类别的训练数据按照以上分类函数进行判别,既使分类函数是由训练数据推导出的,也不一定能全部正确分类。由表5可知,原始样点中769个一等地样点有7个被误判为二等地,其余762个样点仍为一等地;1 827个二等地样点有155个被误判为一等地,118个误判为三等地,其余1 554个样点仍为二等地;三等、四等地亦然。得到的辉县市耕地地力等级见图2。
  3.2 地力等级判别结果检验
  对研究区耕地地力等级Fisher判别结果的检验采用卡方检验和回代法两种方法,判别分析技术能否正确、有效地对样本进行分类归属,通过统计结果的显著性分析进行评估。假设样本通过判别分析函数得到的分类结果同主观猜测的结果没有差别,那么构造统计量:
  式中,N为样本总数;g为组数;o为正确分类的观测值。因其服从自由度为1的卡方分布,所以其值若大于3.84(α=0.05)或6.64(α=0.01),表示基于判别分析技术获取的结果和随机臆测的结果有显著不同。研究区样点总数N=5 922,耕地地力等级数g=4,基于判别函数获得正确分类的样点数o=5 410,构造的统计量远大于6.64,所以可以肯定地说基于判别函数获得的样本分类结果与随机臆测的结果有显著不同(表6)。
  在实际应用中,还可以采用回代法计算判别模型的回判率η来进行模型检验:
  η=判對样本数n(13)
  一般η>75%即认为判别模型有效。将样点数据回代判别模型,得回判率η=5 410/5 922= 91.35%,错判率较低,说明此模型能很好地应用于耕地地力状况的判断分析和归类分级。
  4 结论
  (1)河南省辉县市的案例研究表明,Fisher判别分析算法在确定研究区样点地块地力等级归属方面具有较好的应用前景,其简捷、高效、精准的特点使判别分析法在多指标、多因素分类系统的样本归属判断领域具有巨大的应用潜力。
  (2)判别分析算法是在分类确定的条件下,根据样本的各特征值判别其分类归属的一种多变量统计分析方法。因此,其主要劣势在于在判别分析之前,需从研究区大量样本的属性特征中遴选分类因素、建立分类系统;分类系统直接决定判别分析结果质量的高低,这也是机器学习算法的共同特征。
  (3)Fisher判别函数只适用于与已知分类样本相同属性变量的未分类样本的类型归属。在该案例研究中,如果研究区未分类样点的属性变量少于、或者包括但不限于表层土壤质地、土壤剖面特征、地表砾石度、速效钾、有效磷、有机质含量、灌溉保证率、排涝能力、地貌类型、地面坡度等10个属性变量,则判别分析结果的准确度将受到显著影响;同时,该案例研究区为范围较小的县域,气候特征基本波动不大,若推广应用于大区域范围,则需对评价指标做增删改,评价精度低于小地域,Fisher判别分析需根据实际情况加以改进。
  参考文献
  [1] 陈艳春.兴安县耕地地力等级划分与评价[J].南方农业学报,2011,42(7):768-770.
  [2] 王瑞燕,赵庚星,李涛,等.GIS支持下的耕地地力等级评价[J].农业工程学报,2004,20(1):308-310.
  [3] 吴克宁,郑义,康鸳鸯,等.河南省耕地地力调查与评价[J].河南农业科学,2004,33(9):49-52.
  [4] 杨华容,王怀英,彭文甫,等.区域土地利用/覆被时空动态变化研究:以四川省金堂县为例[J].中国农业资源与区划,2016,37(8):37-46.
  [5] DULAM J.Discriminate analysis for dust storm prediction in the gobi and steppe regions in Mongolia[J].Water,air & soil pollution:focus,2005,5(3/4/5/6):37-49.
  [6] CHEN L,ZOU L J,TU L.Stream data classification using improved fisher discriminate analysis[J].Journal of computers,2009,4(3):208-214.
  [7] 张学雷.计算机判别分析在土壤分类中的应用:以山东省褐土分类为例[J].山东师大学报(自然科学版),1991,6(4):74-81.
  [8] FU L.The discriminate analysis and dimension reduction methods of high dimension[J].Open journal of social sciences,2015,3(3):7-13.
  [9] 邱琳,张富,李安波.应用Fisher判别分析和案例推理两种方法的土壤类型预测及制图比较[J].江苏农业学报,2012,28(6):1459-1465.
  [10] BELHUMEUR P N,HESPANHA J P,KRIEGMAN D J.Eigenfaces vs.fisherfaces:Recognition using class specific linear projection[J].IEEE transaction on pattern analysis and machine intelligence,1997,19(7):711-720.
  [11] 聂长明,袁长岭,梅俊杰,等.河南省辉县市耕地地力评价工作报告[R].河南:辉县市土壤肥料管理站,2012.
  [12] 周颖,张侠,周峰.江苏省耕地地力等级划分[J].南京大学学报(自然科学),2003,39(4):580-586.
  [13] 盛艳,姚云峰,秦富仓,等.基于GIS的耕地地力等级划分研究[J].干旱区资源与环境,2014,28(6):27-32.
  [14] 刘占朝.豫北太行山区土壤有机质含量分布规律[J].河南林业科技,1992,3(1):18-19.
  [15] 周俊,杨子凡,孙成胜.基于GIS的市级耕地地力评价:以张掖市为例[J].中国农业资源与区划,2014,35(6):39-44.
  [16] 余颂,陈善雄,余飞,等.膨胀土判别与分类的Fisher判别分析方法[J].岩土力学,2007,28(3):499-504.
其他文献
摘要 利用NCEP位势高度场资料及国家气候中心160站的月平均降水资料,对西北地区东部(32.5°~41.0°N、100.0°~112.5°E)持续性干旱事件有关的大气环流进行了分析。结果表明,持续性干旱发生时期合成的500 hPa异常位势高度场在欧亚大陆上空的环流形势基本为两槽一脊,欧洲及渤海、黄海及周围地区为槽,西北地区东部位于脊前;渤海、黄海及周围地区上空对应负异常是持续性干旱发生的典型环流
期刊
摘要 [目的]研究桂东南福建柏林分直径结构。[方法]以桂东南福建柏人工林为研究对象,采用典型选样法设置15个20 m×20 m的样方,开展植物群落调查。以2 cm为径阶距,应用理论生长方程Richards,Logistic,Gompertz,Mitscherlich和Weibull分布函数对林分直径分布进行拟合,采用卡方检验法对5种分布进行检验。[结果]福建柏林分平均胸径19.3 cm,在5.7~
期刊
摘要 [目的]探讨性诱剂对食物诱剂引诱作用的影响。[方法]通过室内试验和田间试验研究了性诱剂对食物诱剂控制瓜实蝇的干扰作用。[结果]实验室测试结果表明,在食物诱剂中添加性诱剂对瓜实蝇的干扰较大,引诱虫口数量显著减少。田间试验也证明了这种影响明显存在并影响食物诱剂的防效。在只悬挂食物诱剂时,食物诱剂能迅速降低瓜实蝇的田间虫口密度并长期控制在较低的水平之下,防治效果显著,好瓜率在90%以上,而添加性诱
期刊
摘要 [目的]明确凤阳玉米穗腐病的病原菌种类。[方法]在凤阳玉米种植区采集玉米穗腐病样品,采用组织分离法对病样进行分离与纯化,结合病原菌形态学特征与分子生物学进行鉴定。[结果]分离得到的56株病原菌分别为禾谷镰孢菌(Fusarium graminearum)、尖孢镰孢菌(Fusarium oxysporum)、串珠镰孢菌(Fusarium verticillioides)、多变根毛霉(Rhizom
期刊
摘要 利用黑河地区1968—2015年5—9月的降水资料对时间尺度为12个月的SPI指数进行了计算,探讨了黑河地区干旱发展特征及变化趋势。结果表明,近48年内SPI最大值出现在2013年,最小值出现在2008年;2007年以后总趋势在向干旱发展,2015年前后达到顶点,未来几年黑河地区有向干旱发展的趋势。从旱涝趋势的变化周期来看,16年的时间尺度为旱涝变化的第1主要周期。2015年黑河地区处于丰水
期刊
摘要 利用丹东地区气象观测站1954—2016年逐月降水量、蒸发量等资料,采用K干旱指数划分干旱等级、监测干旱状况,并检验在实际监测中的应用效果。结果表明,与实际的旱情比较,K干旱指数在丹东地区干旱监测中有较好的监测效果。  关键词 K干旱指标;降水量;蒸发量;干旱监测  中图分类号 S16 文献标识码 A 文章编号 0517-6611(2017)25-0193-03  Abstract Base
期刊
摘要 通过大量的实地调查并结合已有文献资料,对钦州市的园林植物种类、主城区绿化主要特点和园林景观效果进行了评价。分析了钦州市园林绿化工作的优势和存在问题,并提出了要重视园林植物景观规划设计、钦江和人工湖的水体绿化、立体绿化和发展乡土树种等一系列建议,旨在为钦州市绿化水平的提升和国家生态园林城市建设提供依据。  关键词 钦州市;园林植物;景观效果;评价  中图分类号 S688 文献标识码 A 文章编
期刊
摘要 [目的]研究多功能烟草作物打穴施肥机的应用效果与推广价值。 [方法]对多功能烟草作物打穴施肥机(T)与人工作业(CK)在不同土壤类型、不同垄型作业用工、作业质量与作业成本进行对比分析。[结果]多功能烟草作物打穴施肥机能大大降低烟农打穴施肥环节劳动强度和用工成本,且穴深、穴宽、株距均匀,施肥量精准,土肥混合均匀细碎,大大提高了打穴施肥工作效率,平均降低作业成本1 681.93元/hm2。 [结
期刊
摘要 人类对水资源的需求量随着人口数量的增长而增长,水资源保护与合理开发对国民经济的发展有着重要影响。云南省2001—2015年水资源总量由2 561.94亿m3降低到1 872.00亿m3;其中昆明市2015年水资源总量为66.43亿m3,农业用水只占总量的12%。为解决水资源短缺和区域水资源安全问题,从而引入虚拟水的研究。结合气象资料,利用CROPWAT软件对昆明主要农作物需水量和灌溉用水量进
期刊
摘要 利用常规气象观测资料、环流再分析资料,采用天气动力学诊断方法和强天气分析技术,对兰州市2015年7月连续11 d的强对流天气成因进行分析,针对致灾最重的7月13日雹暴天气进行大尺度环流背景、物理量场及中尺度分析;同时,将2013年8月连续5 d的强对流天气与2015年7月连续11 d的强对流天气进行天气实况、环流形势的对比分析。结果表明,夏季500 hPa高空蒙古冷涡与新疆至青海一带的大陆高
期刊