基于Adaboost算法的多分类器模型的研究及其在降水预测中的应用

来源 :南京信息工程大学 | 被引量 : 2次 | 上传用户:na2222222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济的不断发展与进步,各行各业的发展与需求对气象预测要求在不断提高。与传统的气象预测模式相比,获取气象数据的渠道日益丰富,气象数据资料呈现爆炸式增长,如何有效利用这些海量气象数据对于推进气象领域进步有决定性作用,气象数据具有的高维性和大规模特点,意味着传统的气象模式很难将各维度的气象数据以及各气象数据之间有效联系起来,而现今的数据挖掘技术较为成熟,为研究与探索气象领域中各个属性内在规律与联系、寻找天气变化有指导性意义。本论文针对气象中降水预测问题进行研究与分析,在掌握和分析现有最新气象数据挖掘技术的基础上,对现有的天气预测模型提出相应改进。摒弃单分类的气象预测模型,利用Adaboost算法集成强分类器达到提升性能的目的,通过详细研究气象样本数据特点,对气象数据挖掘建模,数据属性处理,并对集成预测模型进行深入研究,主要完成以下工作。(1)针对Adaboost算法集成分类器在气象降水预测中存在着学习性能退化而导致的精度不足问题,本文通过理论推导证明集成分类器的误差上界与学习过程中归一化因子的关系以及优化的本质思想,对Adaboost算法在样本的学习过程中权值的更新方式进行调整,提出基于归一化因子与依赖度的权值修正算法,改进后的算法目标是依据信赖度调整样本的权值的更新幅度,以此来缓解误差累积问题,从而达到提高性能的目的,实验表明,该种改进方式提高了预测的性能。(2)针对气象领域中的降水数据集总是存在着数据集分布不平衡问题,本文提出基于损失代价敏感的不平衡学习方式,通过改进Adaboost算法中每个样本根据不同的分类预测结果而产生不同的损失代价为核心思想,以最小化损失代价为目标函数,引入惩罚因子,通过理论证明与推导,调整基分类器学习过程中的权值更新方式,同时给出基分类器的误差阈值。通过实验表明,该种改进确实提高了对数据集中的少数类的学习能力,有效的提高了集成分类器的性能。通过降水实验以及评价方案的数据结果可知,本文提出的改进算法与传统数据挖掘算法相比,有较好的性能体现。该种预测模型增强了气象预测效率,且对气象数据总是具有良好的表现,为以后的气象数据挖掘提供了更好的解决方案借鉴。
其他文献
根据城镇燃气聚乙烯管道运行时易被破坏的情况,阐述了聚乙烯燃气管道抢险维修的几种工艺,分析了各种工艺的优缺点,提出了抢险维修技术的适用范围和应用时的注意事项。
会议
以一种优化的最大电压偏差均压方法为基础,推导出模块化多电平变流器(MMC)平均开关频率的解析表达式,并分析了影响MMC开关频率的因素,对MMC损耗计算和散热设计具有一定的指导意
本试验旨在比较饲粮纤维水平对杜洛克仔猪、高黎贡山仔猪生产性能、小肠形态学、小肠黏膜金属硫蛋白1(MT1)和组织急性期蛋白(APPs)基因表达的影响。选用35日龄高黎贡山断奶仔
文章论述了基于单片机和CPLD的等精度数字频率计的设计方法,等精度的测量方法具有较高的测量精度和整个频率区域保持恒定测试精度的特点。该频率计利用单片机完成整个测量电路
张艺谋是中国第五代电影人的代表人物,电影《红高粱》作为他的代表作,属于"视觉系"的影视艺术作品,美术学的色彩象征在影片中得到了极致的运用。作为豪放派中的"写意派",电影
“阅读提示”$$ 3月18日,由中央电视台、山西省委宣传部、山西影视(集团)有限责任公司等联合出品的28集电视剧《幸福生活万年长》在央视8套黄金时段播出之后,引起了众多专家学
报纸
全人教育理论为当前高校大学英语自主学习提供了重要参考,也为大学英语混合式自主学习提供了新视角。本文通过对全人教育视角下的大学英语混合式自主学习的研究,分析了当前大
通过热压扩散复合制备钛-铜复合板,研究了温度对复合界面形貌的影响.SEM分析表明扩散界面由Cu4Ti、Cu4Ti3、CuTi、CuTi2化合物相组成,同时存在2个不同衬度的Cu4Ti相层.复合板
民族主义与国家增生的类型及伦理道德思考时殷弘民族主义是现代[1]世界进程中最重要、最引人注目的动力之一。凡现代历史中具有世界性影响的重大政治事态,从宗教改革到法国大革命