论文部分内容阅读
随着信息技术的飞速发展,经济、管理和金融等领域产生了大量的时间序列数据。对于时间序列数据的挖掘越来越引起人们的高度重视,其主要目的是获取时间序列数据中隐含的有价值的知识和信息。重复出现的周期行为在时间序列数据中是广泛存在的,对周期模式挖掘的研究有着重要的理论价值和现实意义。由于数据源及传输过程中存在的问题,导致实际时间序列中噪声是不可避免的,研究噪声环境下的时间序列周期模式挖掘更具挑战性。本文基于动态扭曲距离,研究提出一种新的部分周期模式挖掘方法,重点是处理带噪声的时间序列数据,并应用于静态时间序列和动态时间序列(数据流)的挖掘。本文首先综述了时间序列数据挖掘和周期模式挖掘的研究现状,指出目前部分周期模式挖掘算法存在的不足。其次,给出和本文研究相关的一些定义和CONV算法。第三,对于噪声环境下的静态时间序列和数据流的部分周期模式挖掘进行深入的研究,并通过仿真数据验证本文所提算法的有效性。最后在总结全文的基础上,指出了本文有待深入研究的问题。本文工作的创新性主要包括以下两点:1、提出了基于动态扭曲距离的时间序列部分周期模式挖掘算法(DTWP)。本文中详细描述了DTWP算法的原理及计算过程,给出算法应用过程中应注意的问题,通过人工数据的仿真试验结果表明,本文所提出的DTWP算法能对噪声环境下的部分周期模式进行有效挖掘,不管是从算法精度上还是抗噪声能力上都优于基于卷积的算法CONV。2、提出了适用于数据流的在线部分周期模式挖掘算法(ODTWP)。基于单滑动窗的原理,改进了传统的动态扭曲距离矩阵,推导出在线周期模式挖掘算法,并对影响算法过程的两个重要参数:窗口长度及滑动大小进行了详细研究。仿真试验结果表明,本文所提出的ODTWP算法能对数据流的部分周期模式进行有效挖掘。