论文部分内容阅读
时间序列数据量远远大于普通数据库的特点,导致一些通用的数据挖掘工具直接应用于时间序列效果很不理想。为此提出了一种时间序列分段线性化表示算法,这种表示方法将大大提高相似性测量的计算速度。在分段线性化表示的基础上提出了一种相似性计算方法,该方法对于时间序列的多种变形都不敏感。将k-平均(k-mean)聚类算法应用于分段线性化表示的时间序列,聚类结果表明算法非常有效。