支持向量机方法在温度预报中的应用

来源 :吉林农业 | 被引量 : 0次 | 上传用户:whjsdsdsd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:本文利用沈阳站温度资料和东北中尺度数值模式预报场资料,采用K-means算法进行季节划分试验,基于支持向量机方法(Support Vector Machine,简称SVM)进行交叉验证和预报检验,试图建立温度季节预报模型。结果表明:聚类季节划分与传统季节划分之间存在差异,传统的春、秋两季被划分为不连续的两类,传统的夏、冬两季被划分的不明显,仅在时间长度上有所差异;支持向量机方法对夏季温度预报准确率最高,各时次温度误差≤2℃的准确率平均为81.2%。冬季温度预报准确率最低,各时次温度误差≤2℃的准确率平均为69.2%。冬季客观方法对夜间降温幅度的预报能力存在不足,而春季客观方法对夜间最低气温的预报能力存在不足。平均绝对误差除个别时次超过2℃外,其他时次均在误差范围内,客观预报方法是可用的。
  關键词:支持向量机方法;聚类分析;季节划分
  基金项目:2015年沈阳市科技局项目(F15-109-3-00)和沈阳市精细化预报团队共同资助
  中图分类号: S165 文献标识码: A DOI编号: 10.14025/j.cnki.jlny.2017.15.012
  沈阳市位于辽河平原中部,受季风影响较大,属于北温带受季风影响的半湿润大陆性气候,全年温差较大,四季分明。夏季热而多雨,冬季寒冷漫长,春秋两季温度变化迅速。随着科技的进步和社会的发展,农业和各种重大活动对气象服务的需求日益增高,温度的精细化预报成为目前天气预报面临的挑战与问题。大气环流的变化存在复杂性和非线性,温度的变化与各种预报因子间存在非线性相关,支持向量机(Support Vector Machine,简称SVM)方法是处理非线性分类和回归等问题的一种有效的方法。近年来,多地气象部门利用模式直接输出产品,应用SVM方法制作各种气象要素预报,取得了一定成果。冯汉中[1]等利用1998年~2000年9~11月T106模式36小时预报的各种输出产品构造因子,以单站有无降水为预报对象,采用MOS法方式构造样本,通过建立单站的晴雨SVM 分类预报模型, 利用1990年~2000年4~9月ECMWF北半球的500hPa高度、850hPa温度、地面气压的0小时分析场资料,确定关键区域,构造预报因子,以PP法方式构造样本,通过训练建立了四川盆地内单站气温的SVM 回归预报模型,并进行了模拟试验,结果表明无论是单站晴雨的SVM分类预报模型还是单站平均气温的SVM 回归预报模型都显示出了良好的预报能力。高永娜[2]等以风向、风速、云量、相对湿度、露点温度、气压6个相关因素为因子,采用Libsvm软件进行预测建模,用真实数据进行分析对比,得出SVM方法预测气温数据与真实数据有较高的拟合度。王在文[3]等利用北京市气象局中尺度业务模式(MM5V3)的数值预报产品和观测资料,制作北京15个奥运场馆站点6~48小时逐3小时的气象要素释用产品,对比MM5V3模式,2 米温度的均方根误差减小12.1%,与同期MOS方法预报结果相对,2 米温度预报效果SVM略优于MOS。
  本文采用K-means算法进行季节划分试验,在东北中尺度数值模式WRF-3KM直接输出产品的基础上,基于支持向量机方法,进行交叉验证和预报检验,建立本地区的温度预报的季节模型,为农业生产及大城市精细化预报业务提供保障。
  1资料与方法
  1.1 资料
  本文所用资料为沈阳站(站号:54342)历史同期(1980年~2010年)温度资料,2013年~2014年东北中尺度数值模式WRF-3KM未来12~36小时预报场资料和沈阳国家观测站实况资料。
  1.2 方法
  1.2.1 SVM方法 为解决基于数据的非线性建模问题,基于V.N.Vapnik等提出的统计学习理论(小样本理论)[4-8],近年来提出了支持向量机(Support Vector Machines,简称SVM,下同)方法[9-10],其基本思路为:以结构风险最小化为前提,定义最优化线性超平面,把寻找最优线性超平面的算法归结为求解一个凸规划问题,从理论上得到的局部最优解,也就是全局的最优解;进而基于Mercer核展开定理,通过非线性映射,把样本空间映射到一个高维乃至于无穷维的特征空间,使在特征空间中可以应用线性学习机的方法,解决样本空间中的非线性分类和回归的问题。本文通过回归问题预报温度。
  回归分析又称函数估计,其解决的问题是:根据给定的样本集{(xi,yi)}|i=1,…,k},其中xi为预报因子值,yi为预报对象值,寻求一个反映样本数据的最优(按某一规定的误差函数计算,所得函数关系对样本数据集拟合的“最好”)函数关系y=f(x)。
  1.2.2 K-means算法 K-means算法[11-12]为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。其基本思想是:随机选择K个对象,每个对象代表一个簇的初始均值,也称初始类中心,对剩余的每个对象,根据其与各个簇均值的距离,将其指派到最相似的簇。然后计算每个簇的新均值,这个过程不断的重复,直到准则函数收敛。本文采用K-means算法进行季节划分试验,K值为4。
  2季节划分
  采用02时、08时、14时和20时的沈阳站历史同期资料,对4个时次进行年平均处理,采用K-means方法,进行聚类划分,按传统的春、夏、秋、冬4季,将所有样本数划分为4类,结果如图1。从图中可以看出,聚类分析后,将具有相同变化趋势的样本划分为一类,与传统季节划分方式存在差异,将传统的春、秋两季划分为不连续的两类,而传统的夏、冬两季划分的变化不明显,仅在时间长度上有所差异。
  3预报方程建立
  3.1 预报因子选取
  选取与温度预报相关的因子,因子包括:500hPa位势高度、700hPa相对湿度、850hPa相对湿度、925hPa相对湿度、850hPa U分量、925hPa U分量、850hPa V分量、925hPa V分量、850hPa 垂直速度、925hPa垂直速度、总云量、海平面气压、地面气压、2米相对湿度、2米温度、地表温度、850hPa温度、10米纬向风分量、10米经向风和总降水量,共20个预报因子。   3.2 预报方程构建
  将样本随机划分成两部分,80%的样本用于方程模型的建立,20%的样本用于模型的检验。共随机抽取10次,寻求建立最优化模型。构建方程时,核函数采用径向基函数(参数包括:参数c和参数g),通过寻求参数c和参数g,建立最优化模型,参数的选择没有规律,因此需要进行大量试验。回归模型的择优标准为绝对差,损失函数叠加上界为2000,回归迭代最大次数10000。
  分析沈阳地区四季温度客观预报方法参数选取表(表1:冬季;表2:春季;表3:秋季;表4:夏季)。冬季参数c:11~83,参数g:0.03~0.15,回归带宽:2.0,支持向量个数占训练样本的24.4%~57.6%;春季参数c:4~100,参数g:0.02~0.21,回归带宽:2.0,支持向量个数占训练样本的20.0%~50.7%;秋季参数c:11~101,参数g:0.02~0.20,回归带宽:1.9~2.0,支持向量个数占训练样本的26.2%~42.1%;夏季参数c:11~83,参数g:0.04~0.15,回归带宽:2.0,支持向量个数占训练样本的17.9%~34.0%。各季节及预报时次的参数之间存在显著差异,由于冬、春季训练样本相对较少,所以依赖的支持向量比重相对多一些。
  4检验
  分析沈阳地区冬季温度客观预报方法检验结果(见表5)。温度误差≤2℃的准确率最高为81.1%,最低为52.3%,平均为69.5%;温度误差≤1℃的准确率最高为48.5%,最低为20.3%,平均为33.1%;温度误差≤0.5℃的准确率最高为28.7%,最低为9.2%,平均为18.6%;从结果来看,预报最差的两个时次时效为27小时和30小时,即夜间23时和02时,说明客观方法对夜间降温幅度的把握还存在一定的不足。平均绝对误差除时效27小时外,其他各时次误差都在2℃以内,表明检验样本中,大多数成员的误差都在2℃以内,只有少数成员超过了2℃的误差,客观预报方法是可用的。
  分析沈阳地区春季温度客观预报方法检验结果(见表6)。温度误差≤2℃的准确率最高为89.6%,最低为50.0%,平均为75.3%;温度误差≤1℃的准确率最高为53.3%,最低为19.1%,平均为37.6%;温度误差≤0.5℃的准确率最高为34.1%,最低为11.9%,平均为21.2%;春季较冬季预报结果有明显提高,预报最差的两个时次时效为30小时和33小时,即清晨02时和05时,正是夜间最低气温出现的时刻,春季客观方法对夜间最低气温的把握还存在一定的不足。平均绝对误差各时次均在2℃以内,12小时时效误差在1℃以内,表明检验样本中,除少数极端样本预报出现失误外,其他成员均在2℃的误差范围内,客观预报方法可用。
  分析沈阳地区秋季温度客观预报方法检验结果(见表7)。温度误差≤2℃的准确率最高为87.2%,最低为69.3%,平均为76.6%;温度误差≤1℃的准确率最高为45.7%,最低为24.0%,平均为40.7%;温度误差≤0.5℃的准确率最高为27.6%,最低为16.0%,平均为22.0%;秋季较冬、春季预报结果有了进一步提高,尤其是夜间最低气温的预报,主要是由于秋季最低气温变化相对平稳。平均绝对误差除时效30小时外,其他各时次误差都在2℃以下,客观预报方法可用。
  分析沈阳地区夏季温度客观预报方法检验结果(见表8)。温度误差≤2℃的准确率最高为88.3%,最低为72.2%,平均为81.2%;温度误差≤1℃的准确率最高为50.4%,最低为39.7%,平均为47.0%;温度误差≤0.5℃的准确率最高为29.8%,最低为19.2%,平均為24.3%;夏季客观方法预报是一年四季中最高的,各个时次温度误差≤2℃的准确率都在72%以上,各个时次的平均绝对误差为1.27℃,夏季客观预报方法最为准确。
  5 结论
  本文采用K-means算法进行季节划分试验,在东北中尺度数值模式WRF-3KM直接输出产品的基础上,基于支持向量机方法,进行交叉验证和预报检验,结果表明:
  聚类季节划分与传统季节划分存在差异,将传统的春、秋两季划分为不连续的两类,而传统的夏、冬两季划分的变化不明显,仅在时间长度上存有差异。
  支持向量机方法对四季温度进行预报,其中夏季温度预报准确率最高,各时次温度误差≤2℃的准确率平均为81.2%。冬季温度预报准确率最低,各时次温度误差≤2℃的准确率平均为69.2%。冬季客观方法对夜间降温幅度的预报能力存在不足,而春季客观方法对夜间最低气温的预报能力存在不足。平均绝对误差除个别时次超过2℃外,其他时次均在误差范围内,客观预报方法是可用的。
  参考文献
  [1]冯汉中,杨淑群,刘波.支持向量机(SVM)方法在气象预报中的个例试验[J].四川气象,2005(02):9-12.
  [2]高永娜,郑华珠,刘沈,等.支持向量机方法在气温预报中的应用[J].宁夏农林科技,2012,(06):137-139.
  [3]王在文,郑祚芳,陈敏,等. 支持向量机非线性回归方法的气象要素预报[J]. 应用气象学报,2012,(05):562-570.
  [4] Vapnik V N.Statistical Learning Theory.John Wiley & Sons,Inc.New York,1998.
  [5] Vapnik V N.The Nature of Statistical Learning Theory.Springer Verlag,New York,2000.
  [6] Cristianini N and Shawa-Taylor J.An Introduction of Support Vector Machines and Other Kernel_based Learning Methods.Cambridge University Press,2000.
  [7] Burges C J.A tutorial on support vector machines for pattern recognition.Data Mining and Know ledge Di scovery,1998,2:127-167.
  [8]Courant R and Hilbert D,Method of Mathematical Physics,Volume I.Springer Verlag,1953.
  [9]陈永义,愈小鼎,高学浩,等.处理非线性分类和回归问题的一种新方法(I)——支持向量机方法简介[J].应用气象学报,2004,15(03):345-354.
  [10]冯汉中,陈永义.处理非线性分类和回归问题的一种新方法(Ⅱ)——支持向量机方法在天气预报中的应用[J].应用气象学报,2004,15(03):355-364.
  [11]李凯,常圣领.基于K-means聚类的神经网络分类器集成方法研究[J].计算机工程与应用,2009,45(22):120-123.
  [12]石云平.聚类K-means算法的应用研究[J].理论与方法,2009,28(08):28-31.
  作者简介:鲁杨,本科学历,助理工程师,研究方向:天气预报研究。
其他文献
盛夏时节,来到和龙市南坪镇高岭村,只见118栋黛瓦白墙、飞檐翘顶的朝鲜族特色民居整齐排列,屋顶安装着蓝汪汪的太阳能板,煞是好看。走进73岁村民李富家里,老人自豪地介绍厨房、卧室、卫生间……并说,“是党和政府的好政策让我脱了贫。”他说:“我和老伴岁数大了,身体也不好,每年种地收入不够吃药的钱。这两年大不一样了。2016年住上了新房子,年底我俩分红得到7200元,加上光伏发电项目赚了3000元,收入达
期刊
伴着初夏的和风,农田里渐渐少了辛苦劳作人们的身影。我省的部分青年农场主们利用这段相对闲暇的时间进行学习,给大脑充电,让创业之路更宽,心更明、眼更亮。吉林省阳光工程办公室精心筛选的从事休闲农业、特产业、水稻种植及养殖等产业的32名优秀青年农场主和新型经营主体带头人齐聚长春,他们带着热切的求知愿望和一睹江南休闲农业之大成的迫切心情踏上了南去的列车,前往浙江省嘉兴市嘉善县缪家村“碧云花园”——农业部农村
期刊
通化市委、市政府高度重视新农村建设整市推进工作,为进一步全面贯彻落实中央、省农村工作会议精神,先后召开市委常委会、政府常务会专题研究新农村建设整市推进工作,并于5月19日召开了全市新农村建设整市推进工作会议,对整市推进工作进行了全面部署和安排。为全面完成新农村建设整市推进工作,集中建设了一大批达标村、先进村和标兵村,整体改善农村面貌,着力建成小康社会和建设美丽通化,努力实现农村产业美、设施美、人文
期刊
36. 为什么说转植酸酶基因玉米是安全的?转植酸酶基因玉米有什么好处?  答:尽管植酸酶在玉米、小麦、水稻、大豆等许多植物中都存在,人类或动物有长期安全食用或饲用的历史,同时转植酸酶基因玉米主要用于动物饲料,但是为了慎重起见,仍按照食用安全评价标准进行了评价。国家农业转基因生物安全委员会的安全性评价结果表明,转植酸酶基因玉米“BVLA430101”与非转基因对照玉米同样安全。  一是在营养学评价方
期刊
摘要:粮食问题不仅关乎国家的经济发展,而且对人们日常生活有重大影响。本文对水稻直播技术进行介绍,分析其在北方杂交粳稻中的应用和优化,以期为我国农业发展做出贡献。  关键词:水稻直播技术;北方杂交粳稻;水稻产量  中图分类号: S511 文献标识码: A DOI编号: 10.14025/j.cnki.jlny.2017.15.003  在我国农业与粮食安全一直以来都是相关部委重点关注的对象,它不仅关
期刊
2016年,德惠市抓“早”、抓“抢”、抓“优”,在年底前顺利完成了5万亩农发高标准农田建设任务,共新建农道桥7座、涵管桥200座, U型槽衬砌渠道258.194公里,铺修机耕路54.41公里,确保了当年任务当年完工,在全省高标准农田建设项目上树立了标杆。  一、抓“早”字,提前做好前期工作  2016年德惠农发高标准农田项目建设规模5万亩、投资6000多万元,项目区定在岔路口镇北部的程家、毛家等6
期刊
近年来,四平市深入贯彻落实国家、省、市关于新农村建设的一系列重大决策部署,紧紧围绕“生产发展、生活宽裕、乡风文明、村容整洁、管理民主”的20字新农村建设方针,精心组织,创新举措,统筹推进美丽乡村建设,呈现出了农村基础条件明显改善、农村生活环境持续优化、农村面貌焕然一新的喜人成果。  一、创新模式,引领开启美丽乡村建设新篇章  以美丽乡村典型模式培育为抓手,精心组织,科学谋划,加快推进美丽乡村整市示
期刊
摘要:俗话说“见苗三分喜,秧好半年粮”,意即水稻高产壮秧是关键。在苏打盐碱地水稻育壮秧中调酸最关键。笔者从事水稻育苗研究近三十年,在实践中总结出一个对稻苗有益无害的高浓度调酸值;2006年聘请国家级和省级农业知名专家,在公证处的公证下进行了田间实验。  关键词:苏大盐碱地;水稻;育秧;高浓度调酸  中图分类号: S156.4;S511 文献标识码: A DOI编号: 10.14025/j.cnki
期刊
摘要:以雷公山保护区桃江片区天然十齿花种群为调查研究对象,选择6块20米×30米的典型样地,采用相邻格子法对十齿花群落物种多样性进行研究。结果表明,雷公山保护区桃江辖区十齿花群落植物组成共有62科98属132种,十齿花在群落中占绝对优势,重要值为56.21,灌木层十齿花占物种总量的94.53%,个体密度为162.3株/亩。群落中杉科、杜鹃科、壳斗科等为优势科。十齿花种群常见伴生种为杉木、溪畔杜鹃、
期刊
摘要:本文建立固相萃取柱富集,采取气相色谱法测定地表水中甲拌磷。本方法操作简便,萃取时间短,富集效率高,检出限低,精密度和加标回收率符合分析测试要求,有机试剂用量少,适用于地表水中甲拌磷的测定。  关键词:固相萃取;气相色谱法;地表水;甲拌磷  基金项目:中国博士后科学基金资助项目(No.2017M611382);深圳市技术攻关项目(项目名称:重20160117:水产品药物残留快速检测关键技术研发
期刊