论文部分内容阅读
时间序列数据大量存在于生活中的各个方面,对于时间序列数据特性的挖掘研究,具有重要的科学理论意义和工程应用价值本文针对时间序列数据以及时序数据的异常检测问题进行了相关研究,引入了半监督学习和单类分类思想,结合高斯过程机器学习方法,构建了半监督高斯过程时间序列分类和单类高斯过程时间序列异常检测模型,应用于时序数据集的挖掘中,并通过实验进行了验证首先,在传统的高斯过程分类模型的基础上,提出了一种半监督高斯过程时间序列分类算法(SGPTC)本文分析了时间序列数据的特性,进行了时间序列相似性特征度量,然后算法利用标记数据样本和未标记数据样本构造半监督训练集,同时对分类训练置信度的值进行了选择判断,将得到的训练集用于半监督分类器的构造,直到获得最优的SGPTC分类模型最后在仿真数据集和UCI时序数据集上验证了算法的有效性其次,针对特殊应用领域中异常样本难以获取的问题,结合单类分类思想,提出了一种基于单类高斯过程的时间序列异常检测算法(OCC_GP)该算法结合高斯过程先验和回归理论,选取RBF作为核函数,通过对目标类时序数据的特性分析构造特征向量集,指导单类分类器的构造在仿真数据集和TE工业过程时序数据集上验证了OCC_GP算法适用性及其在异常检测应用中的有效性最后,结合时序数据和高斯过程特性,本文设计实现了基于时间序列特性的半监督高斯分类与时序异常检测原型系统,该系统不但证明了SGPTC分类模型和OCC_GP异常检测算法的可行性,而且还设计实现了相应的对比算法,很好的满足不同用户对各算法功能的需求