论文部分内容阅读
时间序列的特征表示和相似性度量这一课题是数据挖掘领域中极其受到关注的热点问题。它是时间序列分类、聚类等过程的基础,有着广阔的应用前景。分段聚合近似表示(PAA)是时间序列特征表示方法中比较常用的一种。针对PAA算法对每一区间都平均对待的这一缺点,提出一种基于小波熵的时间序列分段聚合近似表示(PAA_WE)。把某一区间内的小波能量熵值作为判评这一区间复杂度的指标,按各区间内小波熵值的比重来分配各区间内分段数。通过matlab对从UCI数据集中选出的五种不同类型的数据做出实验验证。实验结果表明:和PAA相比,PAA_WE对序列进行特征表示时产生的拟合误差更小,PAA_WE能比PAA更精确的表示时间序列。LB_PAA下界函数是一种常用的DTW距离的下界函数。由于在本文中证明了PAA_WE能比PAA更精确的表示时间序列,所以将本文提出的PAA_WE方法再引入到下界函数领域,对LB_PAA下界函数做出改进,提出一种LB_PAAWE下界函数。通过公式推导,证明了LB_PAAWE是DTW距离的下界函数。通过matlab仿真实验,对四种下界函数的紧密度做出对比。实验结果表明:LB_PAAWE下界函数和文中所列的其余三种下界函数相比,更贴近于DTW距离,是一种较为紧密的下界函数。本文主要研究了时间序列的特征表示和它的相似性度量这两方面内容,主要工作有:在特征表示方法中提出一种PAA_WE方法。在相似性度量方法中,将PAA_WE方法运用到了下界函数理论中,提出了LB PAAWE下界函数。