论文部分内容阅读
时间序列数据挖掘是从大量的时间序列数据集中提取潜在的、有用的知识,据此预测时间序列的未来。本文结合导师“区域水环境监控及决策支持系统开发(广东省科技攻关项目)”和“流域水污染时滞大系统的建模与控制(国家自然科学基金项目)”的研究课题,进行了时序数据挖掘技术及其在水质预测中的应用研究。其主要内容包括:进行基于时序模式和规则的趋势预测方法研究、进行基于时序趋势结构序列的时序数据挖掘方法研究、进行基于粗糙集和趋势结构序列的时序挖掘方法研究、以及进行时序挖掘方法应用于水质预测上的研究。本文的主要工作、成果及核心部分归纳如下: (1)第一章概述时序数据挖掘的产生背景和研究现状,阐述进行时间序列数据挖掘技术及其在水质预测上的应用研究的价值和意义,给出本博士论文的组织结构和研究内容。 (2)第二章介绍数据挖掘的概念及数据挖掘的几个过程,概述关联规则的概念和关联规则的发现、分类发现的含义和分类发现的主要方法。 (3)第三章,作者给出上升的时间子序列和下降的时间子序列的概念,提出基于时间序列的模式和规则的趋势预测方法。对于给定的时间序列,该技术先把时间序列转换成时间子序列数据集,然后挖掘时间子序列数据集,重点挖掘其上升的或下降的时间子序列数据集,从中提取序列模式和规则;提出基于模式和规则、基于支持度和可信度的时序趋势预测。最后给出挖掘算法。 (4)第四章,作者定义时间序列的趋势结构序列、最近时间子序列、趋势结构相同、基于可信度和基于支持度的趋势预测的概念。作者认为最近时间子序列是时间序列的信息聚集器,在此基础上,提出基于时间序列的趋势结构序列的时序数据挖掘方法。该挖掘方法先把待挖掘的时间序列转换成时序趋势结构序列,然后利用时序趋势结构序列的最近时间子序列隐含的知识或信息,来指导对原时间序列的挖掘;提出基于可信度和支持度的时序趋势预测方法,并给出挖掘算法。