论文部分内容阅读
当前,通过运用数据挖掘对卫星遥测数据进行分析和建模,支撑卫星测试数据自动判读、状态监测和异常检测、故障诊断和预测等,是航天领域研究的热点和挑战问题。然而,现有针对卫星遥测数据的分析方法普遍建立在欧氏距离的基础上,而采用欧氏距离进行数据的相似性度量存在诸多的局限性,如:无法消除参数间强相关性的影响、难以实现异步度量等,因此,针对卫星遥测数据分析中相似性度量方法的不足,本文开展面向卫星遥测数据的时间序列相似性度量方法研究。首先,针对在卫星遥测数据分析中采用欧式距离进行时间序列之间相似性度量,存在不能消除参量之间的相关性影响以及难以实现异步度量等不足,研究能够弥补现存局限的时间序列相似性度量方法,并采用与卫星遥测数据特性相近的公开数据集进行实验验证,从而选取适用于单维和多维时间序列的候选时间序列相似性度量方法。其次,为了验证候选时间序列相似性度量方法针对卫星遥测数据的有效性,将度量方法应用至基于层次聚类和K近邻(K-Nearest Neighbor,KNN)分类的异常检测方法中,在实现卫星遥测数据异常检测的同时,验证了基于动态时间规整(Dynamic Time Warping,DTW)距离的异常检测方法能够识别差异性更小的序列异常模式。最后,设计能够实现数据挖掘算法动态加载的数据挖掘软件平台,应用Matlab与C语言混合编程技术并结合数据挖掘软件平台的标准接口规范,完成相关的数据挖掘算法库的开发与封装,完成时间序列相似性度量方法的软件应用。实验验证结果表明,应用针对卫星遥测数据更为有效的相似性度量方法,能够有效提升基于层次聚类和KNN分类的异常检测方法的异常识别能力,同时,所开发的基于时间序列相似性度量方法的算法库具有较好的实际应用价值。本文的研究工作为后续实际应用奠定了良好的方法和应用基础。