论文部分内容阅读
近年来,数据挖掘的研究得到了快速发展,数据挖掘的成果已经广泛地被运用到了许多行业。时态数据挖掘是数据挖掘研究的一个重要的组成部分。时态特征聚类作为时态数据挖掘的一个重要方向,在时态数据挖掘中研究相对是比较少的。在大量的时态数据中寻找有意义的特征群体,对人们挖掘未知特征认识时态数据具有重要的意义,例如发现股票随不同时间交易量显著变化的特征是什么?本文对时态数据特征的聚类问题进行了比较系统的研究。
本文第一章概述了时态特征聚类的研究背景,并讨论了聚类和时态数据挖掘研究的现状,给出了本文的研究内容。第二章概述了与时间有关的时态数据的概念以及相关性质,定义了若干时态特征的概念。第三章在对各种聚类方法进行比较,并分析了各算法的优缺点最后提出了一种基于K-means时态特征聚类算法,并用股票数据进行数值试验给出了实验结果。第四章提出了一种基于SOM带周期的时态特征聚类算法,并用股票数据做试验,给出相应的实验结果。提出了一种基于K-means与SOM的二阶段时态特征聚类算法。
本文获得的主要成果为:1、定义了多维时态数据的一种表示。2.提出了一种基于K-means时态特征聚类算法。3.提出基于SOM带周期的特征聚类算法。4.提出了一种基于K-means与SOM的二阶段时态特征聚类算法。实验表明了这三种聚类算法可以挖掘一些有趣的特征类,发现一些有价值的规律。