论文部分内容阅读
人们对客观世界里的具体物体或事件进行模式采集时,总是尽可能地多采集测量数据,致使观测样本在模式空间里的维数很大。在过多的数据坐标中,有的可能对刻画事物的本质贡献并不大,有的甚至可以说非常微少。这就需要特征提取与选择,达到压缩模式的维数,使之便于处理,减少消耗。某型号液体火箭(导弹)发动机分一级和二级动力机构,在发动机故障状态监测过程中涉及到了几十种外界或内部参数,这些参数的存在完备地描述了发动机状态。但有些参数与故障模式之间没有必然的联系,所以在监测数据信息处理后,设备故障诊断前,需要进行特征提取与选择,以达到简化计算,节省存储空间和计算时间的目的。
本文介绍了矩阵特征值计算方法,详细介绍了QR分解法求解矩阵特征值的过程,采用伪代码撰写了QR分解法的计算机计算过程,论述了数据源的结构对QR分解法时间复杂度的影响。并详细介绍了主分量分析法提取故障特征的过程,分析了主分量分析法应用于某型号液体火箭(导弹)发动机故障状态仿真数据的特征时的精度与时间复杂度。通过主分量分析法的伪代码程序分析了主分量分析法的时间复杂度,发现在主分量分析法中,QR分解法求解矩阵特征值过程最影响主分量分析法的时间复杂度。在较大规模原始数据情况下,数据维数n对该时间复杂度影响较大,而数据个数m仅在数量很多,如m>n2时,才能对该时间复杂度产生影响;采用核主分量分析法再次对该故障仿真数据进行了特征提取。发现当矩阵特征值个数较少且差距较大时,上升型核函数可进一步扩大特征值差距,从而更有利于特征提取。对某型号液体火箭(导弹)发动机故障状态仿真数据,采用PCA法提取故障特征时,在计算过程中发现27个变量中出现8个主要特征,在贡献率coor=0.99时可提取4个故障特征,在coor=0.999时可提取5个故障特征。而采用KPCA法提取故障特征时,通过变换发现27个变量仅有6个特征存在,直接实现了降维的目的。选取5个故障特征时,贡献率coor达到0.9999的高精度。这说明在矩阵特征值个数较少且差距较大时,采用上升型核函数(如二次项核函数)的核主分量分析法可更加准备地确定原始数据的特征;主分量分析法是当前故障特征提取的主流方法,该方法计算简单。其计算过程中发费的时间取决于数据协方差矩阵的特征值计算。这说明矩阵特征值数值计算方法研究具有重要意义。