论文部分内容阅读
对电厂历史数据的开发与利用是进一步发挥DCS系统功能,提高电厂信息化水平的迫切需要。本文讨论了基于内容的时间序列相似搜索需要解决的两个关键问题:相似测度的构造与选择;数据近似算法。提出了用Minkowski距离以及余弦、Pearson积矩相关系数等作为近似测度,并分析了它们各自的特点。提出了依赖于数据特征的近似算法,分别将Haar变换和FFT应用于慢变非周期性数据的近似和快变周期性信号的近似,并给出了在变换特征空间中两个序列之间欧氏距离的计算方法。最后给出的实验结果证明这一集成Haar变换和FFT的数据近似方法要比单独用哪一种变换数据压缩率更高。