滑动窗口模型下的数据流自适应异常检测方法研究

被引量 : 0次 | 上传用户:marsxiaozhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着航天技术的不断发展,卫星运行的发展趋势为:长期自主稳定运行为主,地面遥控介入为辅。卫星在轨遥测数据是地面工作人员判断卫星健康状态的唯一依据,研究卫星在轨运行时最近一段时间内遥测数据的异常变化具有重要意义。然而,卫星遥测数据具有大量、快速、实时的特性,以数据流的形式传输至地面,传统的数据分析及处理方法无法得到有效应用。而滑动窗口数据流模型的研究对象为距离当前时刻最近窗口内的数据流,是数据流领域的研究热点,其符合卫星遥测数据流异常检测的应用需求。因此本文从卫星遥测数据流异常检测背景出发,对滑动窗口模型下的数据流异常检测方法开展研究。首先,面向卫星在轨遥测数据流在线持续到达的大量性与计算机内存资源有限的矛盾,开展卫星遥测数据流概要生成算法研究,针对当前抽样算法不能综合反映最近窗口内数据信息的问题,提出了基于基本窗口的均匀链式抽样算法(Uniform Basic-windows Chain Sampling,UBCS),实现了以基本小窗口为单位的抽样样本的均匀分布并通过实验验证。其次,针对按时间顺序到达的单数据流中单点异常、连续异常及聚集异常检测问题,提出了基于高斯过程回归(Gaussian Process Regression,GPR)的单数据流异常检测方法,实现了正常数据置信区间的直接输出,相对于朴素贝叶斯(Na ve)与多层感知网络(Multilayer perception,MLP),实验验证了其对于单点异常检测的有效性;再次,针对GPR方法对连续异常检测性能不佳的问题,融合UBCS与GPR提出了UBCS_GPR方法,其有效降低了异常数据在预测窗口中占有的比重,提高了单数据流连续异常检测率;此外,对于聚集异常检测问题,构建基于UBCS_GPR算法的离线模型和在线模型,离线模型确定抽样比及初始在线模型实现正常模式数据的有效建模,在线模型利用其作为输入并实时更新,以跟踪数据流的变化,公开数据集Power与Space验证了其对于聚集异常检测的适用性。最后,针对多数据流异常检测问题,将高维相似性度量函数引入分层聚类方法,提出了HSWStream(High Sliding Windows)算法,实现了面向滑动窗口的多数据流有效聚类,应用于KDD99数据集的不同索引处取得了较好的异常检测效果。本文开展的单数据流与多数据流异常检测技术研究,涵盖了数据流异常检测的两个不同应用层面,通过仿真数据集及真实的公开数据集进行了算法验证,为后期卫星遥测数据流的异常检测应用奠定基础。
其他文献
目的了解揭阳市辖区内企业噪声危害的现状,为今后职业卫生监督管理部门采取更好的预防控制措施提供科学依据。方法采用分层抽样方法,在揭阳市辖区内企业中按不同类型(五金、
随着生物技术的不断发展和系统发育学的深入研究,在重构系统发育树时,研究人员往往要面对更多的挑战和困难:1.需要分析的生物类群中所含有的物种数(或个体数)不断增加;2.单一物种(或
文章对中风先兆证的症状、病机,与现代医学所说的短暂性脑缺血(TIA)的关系进行了探讨,认为火、痰为本病病机之本,脑络阻滞为病机之标,腹实壅塞为病机重要因素。此证与TIA有相合之处
自适应信号处理是数字信号处理的一个重要分支,它除了具有数字信号处理稳定、重复性好和适应性强等特点外,还具有可预见性和无相位偏差等优点。自适应滤波算法是一种能够自动对
开展采区巷道围岩松动圈分布规律及支护技术研究具有重要的工程应用价值。本文以大佛寺矿4号采区108工作面和110工作面为依托,采用试验研究、理论分析和现场实践相结合的方法
声乐演唱与钢琴伴奏在艺术地再现声乐作品时,不仅不应有主次之分,而且还要密切配合,相互依托,使歌声琴声珠联璧合,才能达到艺术地再现音乐作品的目的。本文从四个方面分析了
净石沟煤矿回采易燃特厚大倾角长焰煤,受矿井储量限制,采用不均衡生产,工作面存在极易自燃因素。矿井根据生产进度制订了不同的自然发火预测指标,采用不同的防火方法,有效地
人们对地锚式悬索桥的研究已比较成熟和完善,并形成了相关的分析理论和方法。近年来,国内外学者对于普通单塔、双塔自锚式悬索桥也进行了大量的研究,获得了许多有益成果。但尚无
磁性纳米粒子具有超顺磁特性易分离,壳聚糖具有良好的生物相容性,结合二者的优良特性制备壳聚糖磁性纳米粒子,具有重要的研究价值。本文采用吸附/交联法制得具不同表面特性的壳
目的针对本院急诊科实施机械通气的患者采取院内安全转运的管理临床效果进行分析。方法选取2017年1月至2017年12月本院收治的急诊科机械通气的患者70例,根据住院先后顺序,分