论文部分内容阅读
信息及通信技术的快速发展使得人类社会生活的各个领域都可以通过数字化技术描述为不同模式结构的数据,数据产生的规模得到了爆发式的增长,各种类型和结构的数据的生成、收集和传播的速度达到了实时的水平。如何有效的存储和分析这些具有动态性、非线性、高维性、复杂性、冗余性等多种特征的时间序列数据流,探寻其中的演化规律,在纷繁复杂的时间序列数据流中获取解决复杂问题的知识已经成为了大数据时代迫切需要解决的问题。本文围绕着时间序列数据流挖掘的热点和难点问题,在不同分辨率和不同粒度下对时间序列数据流的相关模式进行了分析。针对时间序列数据流的特点,设计了在线小波变换方法、趋势符号表示方法,以及多粒度时变分形维数的计算方法,并在此基础上,研究了时间序列数据流的多分辨率分段技术、多分辨率频繁模式挖掘技术,以及结合金融时间序列数据流的相关特点,综合利用多分辨率和多粒度的思想,研究了金融时间序列数据流的复杂聚类模式挖掘技术。论文的主要工作如下:1.为了对时间序列数据流进行多分辨率分解,设计了在线离散二进小波分解技术,解决了不同小波函数产生的边界延拓问题,消除了边界延拓产生的数据序列两端的模式扭曲的现象。2.研究了时间序列数据流的多分辨率分段方法,可以同时对不同分辨率下的时间序列数据流进行分段,构建基于分辨率的分段层次结构,并可以依据时间序列数据流的分布变化实时更新分段模式。3.研究了线性趋势的多分辨率符号表示方法,能够有效的表征时间序列数据流的趋势信息,直观的表示时间序列数据流的变化规律。4.研究了多分辨率趋势频繁模式的相关概念及技术,可以对具有相同的趋势组合,以及相似的趋势长度比例的模式进行提炼,挖掘时间序列数据流中频繁出现的趋势模式。5.研究了基于小波变换融合延拓技术的时间序列数据流多粒度时变分形维数计算方法,能够有效的挖掘时间序列数据流分布信息变化的重要特征,有助于全面准确的分析和挖掘时间序列数据流中的隐含知识和规律,从不同的角度研究了时间序列数据流的演化规律。6.将时间序列数据流挖掘的多分辨率分段和多粒度分形维数等相关技术应用到金融时间序列数据流的聚类模式分析中,设计了实时的金融时间序列数据流聚类挖掘方法,可以挖掘金融时间序列数据流在不同分辨率和粒度下的演化规律。