数据挖掘技术在气象资料分析中应用研究

被引量 : 0次 | 上传用户:crackerking
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
气象资料的容量和领域随时间的推移不断增长和拓宽,形成了资料山和资料迷宫。如何有效地利用这些资料是气象领域工作者面临的一个大问题。传统的计算机领域中的处理方法是很难处理这样大规模的数据集,因此必须借助于数据挖掘技术。本文首先综述了目前国内外数据挖掘技术在气象资料分析中的研究和应用现状,阐述了数据挖掘技术应用于气象资料分析中取得的成果和不足。其次,对包头市连续3年逐小时的气象数据建立多维数据集,利用数据清洗、数据集成、数据转换和数据消减四种主要的数据处理方法对气象资料多维数据集进行数据预处理,以提高数据挖掘对象的质量,并最终达到提高数据挖掘所获模式、知识、规则等质量的目的。然后,本文主要研究了以下四种主要的数据挖掘技术在气象资料分析中的应用:利用孤立点分析技术分析气象资料库中出现的异常记录集,发掘了一些异常气象维度值和异常记录集;采用决策树模型建立了降雨预测模型和污染因子浓度值是否超标模型,挖掘出了诸如在何种气象条件下,污染物的浓度会超标等这类规则;采用聚类分析对气象资料进行分组,以便于发现各类气象特征,提出了一种基于类轮廓的层次聚类方法,并利用基于类轮廓的层次聚类方法对气象数据进行了聚类分析,证明了算法的可行性、有效性和准确性;利用关联规则分析技术研究气象资料间频繁相关的气象现象。最后采用SPSS Clementine主流数据挖掘软件和经典数据挖掘模型对包头市气象资料库进行挖掘。在以上研究的基础上,本文探讨了数据挖掘主流技术应用在气象资料分析中的重大理论意义和实用价值,并通过对包头市气象资料的挖掘得出了一些隐藏的、有用的模式、规则和知识。
其他文献
为了探讨收割茬次对紫花苜蓿产量及营养价值的影响,选取了3个紫花苜蓿品种(新牧1号、新牧2号、当地苜蓿),分别年收割三茬,并测定其单位面积鲜重、干重,测定常规营养成分。结
土壤相对湿度是农业自动化灌溉技术的关键性指标,也是当前农田领域研究的热点问题。为了探索土壤电容与土壤相对湿度的相关性,设计了一种测量土壤电容值的方法,通过烘干法对
本文以我国电子业52家上市公司的股权结构与企业价值为样本,利用多元回归模型分析了股权结构与企业价值的关系。结果表明,法人股比例和第一股东持股比例与企业价值显著正相关
在"十二五"规划以来的党和国家的重大战略部署中,多次提到要改革和完善税收制度,而"营改增"则是其中的重要一环。"营改增"试点的"双扩围"的实行在全国范围内产生了巨大的影响
国外治安理论可以划分为转型理论、"破窗"理论和理性选择理论三种主要的理论模式。近年来这三种理论都将重心放在社区治安上。从阻吓理论、"破窗"理论到"问题导向型警政"的演
<正> 上一期我谈了春夏秋冬四季和田园景色,这些都是作曲家用音乐的种种表现手法来刻划大自然的形象,但大自然的范围可真大,远远不是四个季节和某些景色就能包括得了的。例如
对行政规范性文件进行评估之前必须明确评估的标准,而合法性标准是其评估的核心标准。合法性的评估标准在评估实践中具体表现为形式合法性、程序合法性、实质合法性三个方面
离岸服务外包是全球范围内掀起的新一轮产业转移浪潮。文章深入分析了天津服务外包产业的发展现状,采用SWOT分析法总结天津承接离岸服务外包业的优势、劣势、机遇和挑战,分别
通过对网站的评价研究可以及时发现网站发展过程中的问题,以便对政府网站进行有效管理,而且实施政府网站评价研究可以促进各级政府部门相互学习和借鉴,了解自身的优势和不足,真正
签订《巴黎协定》之后,各个国家纷纷采取措施应对气候变化。我国拟在2030年前使单位碳的排放量与2005年相比下降60%~65%,低碳经济必然会极大地影响我国企业的发展。论述了发