论文部分内容阅读
随着航天技术的不断发展,卫星运行的发展趋势为:长期自主稳定运行为主,地面遥控介入为辅。卫星在轨遥测数据是地面工作人员判断卫星健康状态的唯一依据,研究卫星在轨运行时最近一段时间内遥测数据的异常变化具有重要意义。然而,卫星遥测数据具有大量、快速、实时的特性,以数据流的形式传输至地面,传统的数据分析及处理方法无法得到有效应用。而滑动窗口数据流模型的研究对象为距离当前时刻最近窗口内的数据流,是数据流领域的研究热点,其符合卫星遥测数据流异常检测的应用需求。因此本文从卫星遥测数据流异常检测背景出发,对滑动窗口模型下的数据流异常检测方法开展研究。首先,面向卫星在轨遥测数据流在线持续到达的大量性与计算机内存资源有限的矛盾,开展卫星遥测数据流概要生成算法研究,针对当前抽样算法不能综合反映最近窗口内数据信息的问题,提出了基于基本窗口的均匀链式抽样算法(Uniform Basic-windows Chain Sampling,UBCS),实现了以基本小窗口为单位的抽样样本的均匀分布并通过实验验证。其次,针对按时间顺序到达的单数据流中单点异常、连续异常及聚集异常检测问题,提出了基于高斯过程回归(Gaussian Process Regression,GPR)的单数据流异常检测方法,实现了正常数据置信区间的直接输出,相对于朴素贝叶斯(Na ve)与多层感知网络(Multilayer perception,MLP),实验验证了其对于单点异常检测的有效性;再次,针对GPR方法对连续异常检测性能不佳的问题,融合UBCS与GPR提出了UBCS_GPR方法,其有效降低了异常数据在预测窗口中占有的比重,提高了单数据流连续异常检测率;此外,对于聚集异常检测问题,构建基于UBCS_GPR算法的离线模型和在线模型,离线模型确定抽样比及初始在线模型实现正常模式数据的有效建模,在线模型利用其作为输入并实时更新,以跟踪数据流的变化,公开数据集Power与Space验证了其对于聚集异常检测的适用性。最后,针对多数据流异常检测问题,将高维相似性度量函数引入分层聚类方法,提出了HSWStream(High Sliding Windows)算法,实现了面向滑动窗口的多数据流有效聚类,应用于KDD99数据集的不同索引处取得了较好的异常检测效果。本文开展的单数据流与多数据流异常检测技术研究,涵盖了数据流异常检测的两个不同应用层面,通过仿真数据集及真实的公开数据集进行了算法验证,为后期卫星遥测数据流的异常检测应用奠定基础。