基于改进贝叶斯网络的气象数据预测算法研究

来源 :太原理工大学 | 被引量 : 6次 | 上传用户:qncy1235p
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和互联网技术的发展,人们的生产生活变得越来越便捷,随之积累的数据量也越来越大。这些海量的数据背后蕴含着丰富的知识和规律,如果能把这些有用的信息挖掘出来,那将对我们未来的生活带来很大的帮助,尤其是在气象领域,这种帮助将更加明显。长期以来,气象预测在人们的生产和生活中都占据着非常重要的位置,大到飞机起飞、火箭发射,小到种植计划、穿衣出行,气象预测深刻影响着我国的科研领域、经济建设和人民生活。近年来,气象事业的现代化水平和现代气象业务体系在不断提高和完善,随之也产生了地面、卫星观测和数值预报等各种类型的大量观测数据,数据量已经达到了PB级。遗憾的是,尽管数据的增长十分迅速,但我们处理数据的技术却发展的相对滞后,传统的数据挖掘方法在面对这些海量数据时,处理和计算都遇到了很大的障碍。在这样的背景下,Hadoop平台的出现为高效地实现海量气象数据的挖掘提供了可能,Hadoop平台利用网络互联技术将若干台计算机连接在一起,实现对资源的集中管理和统一调度。基于Hadoop的海量气象数据预测的基本思想是将传统的气象数据预测算法和Hadoop平台相结合,利用Hadoop超强的计算能力,使海量数据得到充分利用,最终取得更好的气象预测效果。Hadoop技术作为处理海量数据的一种解决方案,具有低成本、高吞吐量、高容错等特点,得到了社会各界广泛的应用。论文深入研究了Hadoop平台和气象数据预测算法,针对朴素贝叶斯分类算法和贝叶斯网络算法在气象预测领域中的一些不足,结合Hadoop平台分布式处理数据的优势和气象数据自身的特性,提出在MapReduce框架基础上运行的贝叶斯网络分类算法,论文主要做了如下研究:(1)考虑到气象数据的海量性,论文采用Hadoop平台对数据进行预处理,并计算任意属性和决策属性之间的相关系数,利用相关系数筛选预测属性,降低了算法的复杂度,提高了模型训练的效率。(2)结合气象数据的特性,对比常用的气象数据预测算法,论文选择了贝叶斯网络分类算法,并利用互信息有关知识对贝叶斯网络结构进行学习。算法在Hadoop平台上运行良好,对气象数据的不确定性和关联性具有较强的适应能力。(3)在算法中加入迭代模型,用测试集对训练得到的贝叶斯网络进行精度评估,如果网络模型不满足系统预设的精度要求,则要修改模型参数,重新对贝叶斯网络进行训练,以获得较优的网络结构。通过和现有气象预测算法进行实验对比,证明了论文改进算法在精度和效率上都有一定的提高。
其他文献
语文教师最头痛的是改学生的作文。学生作文有一种普遍现象:越是写生活中亲近的人就越写得虚假。这有认识上的问题,也有教师引导上的问题。中小学生作文选择身边亲近的人与熟悉
由于建筑常发生火灾,因此,高强混凝土在火灾条件下的性能备受关注.爆裂现象则是火灾中混凝土的一个破坏形态,它的发生条件及机理至今尚未研究透彻.本文从胶砂试件出发,研究了
由于自然界层状岩体分布的广泛性,并且国家近几年各种工程建设趋于高峰期,致使层状岩体的工程稳定问题变得越来越受重视,反映到地下工程中则集中体现在岩体的支护上。层状岩
广播电视监测工作是一项专业性的技术监督工作,对改善广播电视传输和播出质量、维护空中电波和网台播出秩序、严格保护并有效利用频谱资源、及时科学调度播出工作、保证群众
目的探讨颌面部牙源性皮肤瘘道的病因,以减少临床误诊误治率。方法临床38例患者均为牙源性感染,通过皮肤瘘道的部位、病因、牙位等进行根管治疗,拔牙,必要时整形去瘢痕治疗。结果
目的:使用导师自拟宫外孕方,以活血化瘀,消癥化积,理气止痛之法,治疗输卵管妊娠,观察两组患者4周后短期的临床疗效、4周后中医的证候疗效,并持续监测,观察血β-HCG下降至正常
建立了聚合射流氧枪数学模型,基于CFD计算软件对有无伴随流的超音速氧气射流特征进行了模拟,以射流温度和密度计算云图阐明了火焰伴随聚合射流的基本原理,分析了不同伴随流条
职业学校计算机实验室建设,除了能够为培养创新技术人才提供一个良好的环境之外,还能够为其院校的科研发展提供支持。职业学校自身的职责就是为社会培养更多具有优秀综合素质