时间序列相似搜索方法的研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:youthboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列数据泛指随时间或空间有序变化的数据,这些数据往往采用等时间或等空间间隔测量。时间序列数据广泛应用于商业、经济、地质、生物医药、太空探测等诸多科学工业领域中。如何充分有效地管理和利用这些时间序列数据,从中发现隐藏的规律和知识,受到广泛关注。由于时间序列数据具有高维性、噪声干扰及波动性等特点,因此时间序列数据挖掘成为数据挖掘中的一个重要研究方向。   时间序列数据挖掘大体可以分为时间序列表示和挖掘两个阶段。时间序列表示是提取时间序列的主要特征,在更高层次上对时间序列重新描述。挖掘是指对表示后的时间序列做进一步的数据挖掘工作。本文主要在时间序列表示和相似搜索方面做了相关研究。本文主要工作为如下几个方面:   1.时间序列的表示是时间序列数据挖掘研究的基础。重要点的分段表示法(IP)是目前应用最为广泛的时间序列特征提取方法之一,具有较好的数据压缩和去除噪声能力,但参数的选择对时间序列的近似效果有很大的影响。基于多分辨率的重要点检索分段方法(MIP)也是一种时间序列特征提取方法,该方法能很好的近似时间序列,但运行效率比较低。为了改进以上两种方法的不足,我们提出了一种改进的序列分段的方法:基于重要点的多分辨率检索表示法。针对时间序列的benchmark做了大量的实验,从误差,压缩率、效率等方面来衡量本文方法和前面两种方法。实验表明,与基于重要点的分段方法相比,MRIP方法能对时间序列进行更好的压缩,误差更小,有更好的近似效果;与基于多分辨率的重要点检索分段方法相比,在近似效果相当的情况下,运算效率更高。   2.基于BIRCH聚类特征及凝聚层次聚类的思想和时间序列数据相邻的点有内在的依赖关系,本文提出了基于聚类特征的时间序列划分算法(Segmentationalgorithm for time series based on BIRCH Clustering,简称SBC)。对时间序列的benchmark做了相关划分实验,并和经典的SW划分算法进行实验对比。通过实验结果分析,本文划分方法能达到很好的划分性能。   3.采用基于重要点的多分辨率检索表示法提取特征模式后,对提取的模式序列提出了基于斜率模式的动态时间弯曲距离度量(Slope DTW)。采用基于BIRCH聚类特征的时间序列划分算法提取特征模式后,对提取的模式序列介绍了基于均值模式的动态时间弯曲距离度量(Mean_DTW)。对时间序列搜索进行大量实验,本文提出和介绍的距离度量有很好的过滤性能。与全序列DTW搜索相比,只对极少量满足过滤条件的序列与待搜索序列进行全序列DTW距离计算,在时间性能上有很大的提高。
其他文献
随着集成电路技术的快速发展,人们对数据转换和信号处理过程中数/模(D/A),模/数(A/D)转换器的精度要求也越来越高。相对于其它类型的数模转换器,基于过采样和噪声整形技术的
在物理学中,水中气泡运动现象属于气液两相流现象。气液两相流在自然界和日常生活中到处存在,如早晨的浓雾、锅炉里的沸腾与水蒸气等等。气液两相流是指气体和液体两种物质混合
进化算法是一类模拟生物进化过程中自然选择和自然进化的群体启发式随机搜索算法,较好的通用性使其适用于复杂非线性和较少目标的优化问题。但是随着问题求解的各方面性能要
随着互联网与计算机技术应用范围的日益广泛,政府、企业以及个人对计算机的依赖程度越来越高。与此同时,计算机网络的安全问题也越来越严峻。目前,计算机网络安全技术主要包
随着软件产业的快速发展,软件系统的规模越来越大,软件系统也越来越复杂,因此软件开发难度也在加大。为了在软件开发过程中更好的分离关注点,人们先后提出了结构化以及面向对
自从20世纪90年代以来,互联网技术飞速发展,业已成为经济、政治、科技、教育、文化和娱乐等各个方面的重要组成部分。作为全球化的信息载体,互联网上的信息也呈爆炸式增长。
随着互联网的普及,网络游戏已经成为最主要的互联网应用,是人们主要的娱乐方式之一。游戏外挂是一直困扰着网络游戏的问题,因此如何检测外挂是网络游戏运营商的主要问题,然而外挂
农产品产地环境对农产品质量安全具有直接、重大的影响。近年来,农产品产地的土壤、大气、水体被污染而严重影响农产品质量安全的问题时有发生。因此,抓好农产品产地管理,是
对数字图像进行篡改的技术已经变得日趋成熟并被广泛应用,目前人们已经很难从肉眼直接判断出一幅数字图像是否经过修改。鉴于数字图像可以具有作为法庭证据等重要应用,设计一系
随着信息技术的发展,多媒体视频压缩标准已在很多领域得到了成功应用,如VCD(MPEG-1)、视频会议(H.263)、DVD(MPEG-2)和机顶盒(MPEG-2)等等。MPEG-4作为第二代视频编码标准,以