沙尘暴资料的数据挖掘算法分析及系统实现

来源 :兰州大学 | 被引量 : 0次 | 上传用户：talaima116

【摘要】

：

本文介绍了国内外沙尘暴研究现状和气象数据挖掘现状,及数据挖掘的过程模型、标准和规范、数据挖掘的技术、数据挖掘步骤等基础知识,并对Microsoft的数据挖掘规范OLE DB for

【作者】

：

陈旭辉

【机构】

：

兰州大学

【出处】

：

兰州大学

【发表日期】

：

2008年期

【关键词】

：

气象数据沙尘暴数据挖掘时间连续空间连续时空连续连阴雨算法关联分析多元回归聚类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文介绍了国内外沙尘暴研究现状和气象数据挖掘现状,及数据挖掘的过程模型、标准和规范、数据挖掘的技术、数据挖掘步骤等基础知识,并对Microsoft的数据挖掘规范OLE DB for DM和数据挖掘扩展(DMX)做了简要介绍。国内气象数据挖掘的研究尚处于起步阶段。气象数据挖掘具有较大的挑战性。其原因有二:其一,气象数据是一种复杂数据,即是空间数据,又是时间序列数据,且其存储格式多种多样;其二,气象数据挖掘任务比较复杂,专用挖掘算法比较少。通过分析用户的需求,首先确定了沙尘暴数据挖掘的任务,并提出解决该任务的数据挖掘算法。从西北241个站46年的气象观测资料中选择与任务相关的数据,并对数据进行清理转换后建立数据仓库。开发了可视化的交互式数据挖掘界面,使数据清理转换、数据挖掘、模式评估、挖掘结果显示等都在一个可视、交互的平台下进行。本文尝试将常用的挖掘算法如关联分析、回归分析、聚类、空间分析等应用于气象数据挖掘,得到了一些有用的知识。本文为了解决气象领域问题,采用简化的DBSCAN方法实现了“圆形区域连续算法”和“简单时间连续算法”;并针对基于密度的聚类算法存在漏簇的不足,提出了ε-圆扫描法、矩形扫描法等算法,这两个算法可以准确地在样本区域内发现是否存在满足条件的高密度连续区域;本文提出了一个基于约束的具有簇评价功能的连阴雨算法(Continuous RainFall & Overcast,CRFO),该算法采用分层聚类的思路实现,可以有效地解决气象领域中时间连续问题;本文也提出可折叠任意时段周期值抽取算法,该算法解决了OLAP钻取、简单SOL汇聚无法实现有折叠资料的汇聚功能。利用沙尘暴数据挖掘系统,发现了一些中国西北地区沙尘暴很重要的特点,这些知识可以帮助气象科研人员或气象预报员研究或预报沙尘暴的起源、移动、出现时间、出现次数等,这说明数据挖掘技术在气象数据挖掘方面的应用是有效果的。利用数据挖掘技术对气象数据实施挖掘是可行的,但要在气象领域广泛使用,还需要针对气象数据和气象工作的特点,提出解决气象问题的专有算法,并要充分利用领域知识对模式作评估,还要解决气象数据挖掘效率低的问题。

其他文献

模糊聚类方法生成本体的案例研究

本体论最早是一个哲学概念。在哲学中，它主要研究存在的本质。但近几十年里，这个词被应用到计算机界，被定义为对概念化的精确描述。本体作为一种分类学的研究工具在人工智能、计

学位

带弱阻尼项的Korteweg-de Vries方程的Fourier谱方法

本文考虑了一维带弱阻尼项的Korteweg—de Vries方程，通过对带有弱阻尼项的Korteweg—de Vries方程的周期和初边值问题的研究，提出了此类方程的半离散Fourier谱格式，并证明了其

学位

高阶方程弱阻尼项谱格生成方程离散

洛伦兹球面中的Ⅲ型洛伦兹等参超曲面

本文研究洛伦兹球面S1n+1和S15中的Ⅲ型洛伦兹等参超曲面.给出了S1n+1中Ⅲ型洛伦兹等参超曲面的互异主曲率个数和S15中的Ⅲ型全脐洛伦兹等参超曲面的局部参数化和局部刚性定

学位

洛伦兹球面洛伦兹超曲面等参超曲面解析表达式

Hopfield神经网络的稳定性及其在投资组合理论中的应用

本文主要讨论了三个方面的问题：使用径向基函数神经网络对股价进行预测，Hopfield神经网络的稳定性及算法改进，Markowitz模型的求解. 现代投资组合理论是由1990年度Nobel经济

学位

Hopfield神经网络稳定性径向基函数股价预测投资组合Markowitz模型迭代方程

平流环境中不同边界条件下物种的动力学行为

本文主要研究在平流环境中N F/FF和N F/H边界条件下的单个物种模型以及两个竞争物种模型.第一章为引言，我们介绍了问题的背景和近年来得到的一些结果，并介绍本文的主要工作。第

学位

物种竞争种群动态反应扩散动力学行为

图的独立圈和2-因子理论的几个最新结果

本文所考虑的图，既有无向图，又有有向图。对于无向图G=G（V（G），E（G）），我们用V（G）和E（G）分别表示图的顶点集和边集。对任意υ∈V（G），用dG（υ）表示υ在G中的度数。△（G）和δ（G）分别表示图G中的最大度和

学位

独立圈哈密顿圈哈密顿图图论

基于Gabor变换与流形学习理论的人脸识别算法

近年来,流形学习作为一种新的维数约简方法开始受到极大关注。流形学习假设数据分布在一个低维流形上,算法试图通过保持数据的局部几何结构将原始的高维数据嵌入到低维子流形

学位

流形学习Gabor滤波器特征提取局部敏感判别分析人脸识别局部切空间排列监督学习无监督学习

关于蕴含k部图的极值问题

设G是简单图，其顶点集为y(G)={u1，u2，…，un}，di为Vi的度，I=1，2，…，n，且d1≥d2≥…≥dn．则π=(d1，…，dn)称为图G的度序列．设π=(d1，…，dn)是一非增的非负整数序列，若π是某个简单图G的度序列，则

学位

k部图极值问题可图序列非负整数序列

Moore-Penrose逆的表示及扰动分析

矩阵的乘法扰动在结构最小二乘问题的求解，分块矩阵的Moore-Penrose逆的表示等方面有重要应用.设T∈Cm×n为固定，形如M=ETF*的这种矩阵称为T的乘法扰动，其中五E∈Cm×m,F∈Cn×n

学位

Moore-Penrose逆乘法扰动扰动估计范数上界加权最小二乘

参数化设计中确定参数有效范围的DM分解算法的研究

计算机辅助设计(Computer Aided Design,简称CAD)是一种利用计算机的硬件和软件来进行产品的建模、修改、分析和优化的设计活动,它广泛的应用在科研和生活的各个领域中。现在

学位

几何约束求解几何体DM分解吴方法参数的有效范围

沙尘暴资料的数据挖掘算法分析及系统实现

与本文相关的学术论文