论文部分内容阅读
符号化表示技术,可以有效降低时间序列的维度,是实现海量时间序列数据挖掘的基础。聚类结果的精度是运用聚类方法对多元时间序列进行符号化表示的关键。运用共同马氏距离虽然可以实现多元时间序列的符号化表示,但忽略了不同类样本数量对聚类结果的影响,从而降低了符号化表示的有效性。针对上述问题,提出一种改进共同马氏距离的多元时间序列符号化表示方法,通过改进共同协方差矩阵的计算方法,优化了聚类结果,从而提高了符号化表示的有效性。仿真结果表明,改进后的方法可以更加有效地对多元时间序列进行符号化表示。