论文部分内容阅读
摘要: 针对旋转机械故障特征集非线性强、维数过高导致分类困难的问题,提出一种基于局部质心均值最小距离鉴别投影(Local Centroid Mean Minimum?distance Discriminant Projection,LCMMDP)的故障数据集降维算法。该算法在考虑样本的内聚性和分离性的同时,能够保持样本局部几何结构信息,反映样本与局部质心均值之间的近邻关系。从多个角度提取机械振动信号的混合特征,构建原始高维特征集,通过LCMMDP提取出低维敏感特征子集,利用改进的基于局部均值与类均值的k?近质心近邻分类算法(k?nearest Centroid Neighbor Classification Based on Local Mean and Class Mean,KNCNCM)进行故障模式识别。所提方法集成了LCMMDP在维数约简和KNCNCM在模式识别的优势,可得到较高的故障识别准确率。分别使用一个双转子系统数据集和仿真数据集验证了该方法的有效性。
关键词: 故障诊断; 降维; 局部质心均值; 分类器; 模式识别
中图分类号: TH 165+3; TN911.7 文献标志码: A 文章编号: 1004-4523(2021)02-0421-10
DOI:10.16385/j.cnki.issn.1004-4523.2021.02.023
引 言
旋转机械在现代机电系统中起着至关重要的作用,因此对旋转机械进行状态监测和故障诊断具有极其重要的意义[1]。为了尽可能多地获取故障信息,通常采用多个传感器进行多通道的监测,提取出每个通道的多域故障特征,必不可避免地导致了大量的冗余信息和高度相关的信息形成的“维数灾难”问题[2]。因此,如何消除高维数据中的冗余信息,使通过积累获得的海量故障数据资源拥有开发利用的价值,已成为当今机械信息技术所面临的基本问题。
伴随着大数据技术的快速发展,数据降维已成为数据科学研究领域关注的热点问题。典型的降维算法包括主成分分析(Principal Component Analysis,PCA)[3]与线性鉴别分析(Linear Discriminant Analysis,LDA)[4]等。其中,PCA试图寻找一个最大协方差线性投影矩阵,LDA通过最大化类间散度的同时最小化类内散度,寻找一个最佳投影矩阵;而PCA和LDA都是基于整体样本结构的降维算法,无法表征样本的局部流形结构。针对此问题,相关研究提出了流形学习算法,如局部保持投影(Locality Preserving Projection,LPP)[5]、局部线性嵌入(Locally Linear Embedding,LLE)[6]等算法。LPP是对传统拉普拉斯特征映射算法(Laplacian Eigenmap,LE)[7]进行线性化近似的结果,通过线性化之后的LPP能够以较小的计算损耗获取比较好的数据聚类效果。但LPP仅考虑了样本的局部结构,忽略了有利于分类的类别信息,无法更多地挖掘出高维数据的几何结构信息。针对这种不利的局面,将LDA与LPP算法的优势进行集成,提出了诸多改进算法,如局部Fisher判别分析(Local Fisher Discriminant Analysis,LFDA)[8]、边缘Fisher分析(Marginal Fisher Analysis,MFA)[9]、鉴别局部保持投影(Discriminant Locality Preserving Projection,DLPP)[10]、最小鉴别投影(Minimum?distance Discriminant Projection,MDP)[11]等算法。MDP通过引入类间相似度与类内相似度,不仅描述了样本与类中心的距离关系,同时反映出类间距与类内距的大小关系。但MDP和LDA在高维小样本问题中采用类均值会导致数据特征信息的丢失,不能更好地反映样本类信息[12];另外MDP只考虑了样本与类中心之间的距离关系,忽视了样本点之间的局部近邻关系,无法有效地表征样本集的局部几何信息。针对MDP算法的局限性,本研究提出一种基于局部质心均值最小距离鉴别投影LCMMDP算法。LCMMDP利用样本与其近质心近邻点的均值间的距离设计了与MDP不同的相似性度量机制,欲从流形局部学习的角度重新定义局部类间相似度和局部类内相似度,充分利用了所有样本的局部几何信息和类别信息;另外,LCMMDP在计算过程中利用近质心近鄰点的均值,能够有效地抑制噪声数据对流形学习的干扰,提高算法的鲁棒性。
为实现利用LCMMDP降维后得到的低维敏感特征矢量与故障类型间的准确识别,需选择一种精度高、稳定性好的分类器。基于局部均值的k?近质心近邻(Local Mean?based k?nearest Centroid Neighbor,LMKNCN)分类算法是Gou等[13]为克服离群点对分类性能的负面影响而提出的非参数分类器,其基本思想是用待测样本点到每一类的局部质心均值点的距离大小来指定待测样本的类别。LMKNCN只利用了未分类样本在每类里的近邻的局部均值信息,与类可分离性密切相关的类均值特性并未利用。针对上述问题,根据文献[14]的思想,本研究提出一种基于局部均值与类均值的k?近质心近邻分类方法KNCNCM,在类均值互不相同的情况下,既利用未分类样本在每类里的近质心近邻的局部均值信息,又利用类均值的整体信息进行分类的想法,可以提高LMKNCN的分类性能。
基于上述分析,本研究对LCMMDP与KNCNCM相结合的转子故障数据集降维和分类方法进行探讨,欲从海量数据中挖掘更充分的数据结构信息,为智能故障模式识别技术的发展提供了一种理论参考依据。
5.2.1 参数设定
5.2.2 特征数据集的可分性分析 为了验证本文所提LCMMDP算法的可行性,选择与LPP,LDA,MMC,MNMP,MDP等降维算法进行比较。并将6种算法记为A1,A2,A3,A4,A5,A6。前三个主元的低维嵌入结果如图5所示(图中“◇”、“*”、 “☆”、“?”、“○”分别代表转子不对中、质量不平衡、动静碰摩、轴承座松动和正常状态)。
从图5可以看出,LPP的聚类效果最差,其中质量不平衡、动静碰摩、轴承座松动和正常状态四类特征之间离的较近,不易区分;MMC,MNMP的同类特征太过分散,类内距离过大;LCMMDP的聚类效果最好,不同类型特征之间完全分离,各类数据清晰可见,相同类型聚集成团;LPP,LDA,MMC,MNMP,MDP五种算法的不同类型特征之间都存在着一定的混叠,无法有效地区分。
为了进一步说明本文所提LCMMDP算法的可行性,考察降维后的特征集的可分性,引入类间类内距离的可分性参数[18]对测试样本集的分类与聚类程度给予量化评价。设降维后的低维特征子集的C类样本数据为特征集的类间距离、类内距离和可分性参数分别定义为:
由定义可知,类间距Sb反映了各类别之间的分离度,类内距Sw体现了每类样本分布的紧凑程度。低维空间特征集的类间距离越大,类内距离越小,则可分性参数值ρ就越大,特征集的可分性就越好。
按式(20)计算各降维算法降维后的特征集可分性参数值,如表3所示。从表3可以看出,MMC特征集的可分性参数最小,只有12.4167;LCMMDP特征集的可分性参数最大,可高达100.3742。综合图5和表3可知,相比于其他5种降维算法,LCMMDP聚类效果最好,可分性参数最大,说明LCMMDP具有较好的降维效果,在维数约简中有明显的优势。
5.2.3 故障分类效果
为了量化6种降维算法的降维效果,将各个算法降维后的低维敏感特征集输入KNCNCM分类器中进行故障模式识别,得到的识别率如表4所示。
结合表3和表4可以看出:①LPP的识别准确率最低,这是因为LPP是无监督算法,只侧重于局部几何结构信息的提取,而没有考虑类判别信息,导致故障特征解耦不完全,故障特征间仍存在混叠。②LDA,MMC,MNMP相较于LPP的识别率较好,是因为这三种算法均利用了样本的类判别信息,同时考虑了样本的分离性和内聚性。然而,LDA,MMC主要侧重于分析类判别信息,忽视了样本集的局部几何结构信息,导致大量的有用故障特征信息丢失;MMC,MNMP因为不存在小樣本问题,没有利用PCA预维数约简处理,因此无法有效的除去空间中的噪声和冗余信息,导致提取的特征信息无法有效识别故障类别,同时降低了特征集的可分性。③LCMMDP的识别准确率要远高于MDP及其他四种降维算法,是因为LCMMDP将样本的局部几何信息有效地融入到维数约简过程,实现了类判别信息与样本集局部几何结构信息的有效结合。另外,LMMDP利用了局部质心均值,有效地克制了原始特征信息的丢失,一定程度上抑制噪声数据对算法的影响,在挖掘故障样本数据集中蕴含的故障信息的同时实现对故障的有效解耦,可得到最有辨识力的低维特征子集,提高故障特征集的可分性。
为了进一步验证LCMMDP算法的适用性,本文在选取不同的训练样本数量和测试样本数量的情况下,上述6种算法降维得到的低维敏感特征经KNCNCM分类器进行故障模式识别的结果如图6所示。
图6表明,整体上各降维算法的识别准确率都随训练样本的增加而增加。由于LCMMDP充分利用了所有样本的局部几何信息和类别信息,故识别准确率一直较高,稳定性最好;LPP是无监督算法,在少量训练样本情况下,无法有效地保持局部结构信息,识别准确率较低;MMC是一种基于样本整体结构的降维算法,随着样本数量的不足,局部结构信息比全局结构信息更为重要,无法充分地利用样本信息,导致故障诊断效果下降,识别准确率低。
为了提高本研究所提LCMMDP算法的泛化能力,将不同算法在不同转速(分别为2800,3000,3200 r/min)下降维得到的低维特征子集输入KNCNCM分类器中进行故障识别,得到的平均识别准确率如图7所示。由图7可以看出,在不同转速下,LCMMDP降维方法的平均识别准确率都明显优于其他5种降维方法,表明它具有良好的适用性和更高的故障识别精度。
5.2.4 LCMMDP算法的抗干扰能力分析
为了分析LCMMDP的抗干扰能力,将系数γ=0.1,0.2,0.3,0.4的rand随机干扰噪声加入到原始故障集中[19?20],经上述6种算法降维后得到低维特征集,然后输入KNCNCM分类器进行故障识别,得到的识别准确率如图8所示。由图可知,随着干扰系数的增加,6种算法的准确率都有所降低,但LCMMDP降低的速率较慢,且准确率都明显高于其他算法。因此可以看出LCMMDP的抗干扰能力强,相应的鲁棒性较好。
5.2.5 KNCNCM分类器的性能分析
为了验证本文所提KNCNCM分类器的鲁棒性和稳定性,向测试故障集中融入系数为a=0.1,0.2,0.3,0.4的随机干扰噪声,将经LCMMDP降维后的低维敏感特征集输入KNCNCM,LMKNCN,KNN分类器中进行故障模式识别,得到的平均识别率如表5所示。
由表5中可以看出,LMKNCN的识别率高于KNN,原因是KNN的分类性能容易受到噪声干扰和离群点的影响,而LMKNCN利用每类训练样本集里未分类样本的几个近邻的局部均值信息,一定程度上克服了离群点对分类性能的影响;随着噪声的增多,KNCNCM的诊断结果变化较小,平均识别率都高于其他两种分类器,表明KNCNCM相较于LMKNCN和KNN对噪声不敏感,具有优异的稳定性和识别能力。
6 结 论
为使提取的旋转机械故障特征有利于实施故障数据集分类,本研究提出一种基于局部质心均值最小距离鉴别投影(LCMMDP)降维方法和基于局部均值与类均值的k?近质心近邻分类方法(KNCNCM)相结合的旋转机械故障诊断方法。分别通过一个双转子系统的振动信号集合和仿真数据集进行验证,实验结果表明: (1) LCMMDP相比较于MDP,MNMP,LDA,LPP,MMC等降维方法,可提取出可分性更高的低维空间故障特征集,在进行故障模式识别时具有一定的优势。
(2) KNCNCM分类方法既利用未分类样本在每类里的近质心近邻的局部信息,又利用了类均值的整体知识,克服了数据离群点对分类性能的影响,而且一定程度上避免了噪声的干扰,具有一定的稳定性和准确性。
(3) LCMMDP与KNCNCM相结合的维数约简故障诊断模式能够有效地对高维转子故障数据集进行维数约简和故障分类,为旋转机械智能故障诊断提供了一种解决方案。
参考文献:
[1] Wang Z Y, Lu C, Zhou B. Fault diagnosis for rotary machinery with selective ensemble neural networks[J]. Mechanical Systems and Signal Processing, 2018, 113: 112-130.
[2] SU Z, Tang B, MA J, et al. Fault diagnosis method based on incremental enhanced supervised locally linear embedding and adaptive nearest neighbor classifier[J]. Measurement, 2014, 48(1): 136-148.
[3] Turk M, Pentland A. Eigenfaces for recognition[J]. Journal of Cognitive Neuroscience, 1991, 3(1):71-86.
[4] Martinez A M, Kak A C. PCA versus LDA[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2001, 23(2): 228-233.
[5] He X. Locality preserving projections[J]. Advances in Neural Information Processing System, 2003, 16(1): 186-197.
[6] ROWEIS S T,SAUL L K. Nonlinear dimensionality reduction by locally linear embedding[J]. Science, 2000, 290(5500): 2323-2326.
[7] JIANG Quansheng,JIA Minping,HU Jianzhong, et al. Modified Laplacian eigenmap method for fault diagnosis[J]. Chinese Journal of Mechanical Engineering, 2008, 21(3): 90-93.
[8] Sugiyama M. Dimensionality reduction of multimodal labeled data by local fisher discriminant analysis[J]. Journal of Machine Learning Research, 2007, 8(1): 1027-1061.
[9] Yan S C, Xu D, Zhang B Y, et al. Graph embedding and extensions: A general framework for dimensionality reduction[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(1): 40-51.
[10] Yu W, Teng X, Liu C. Face recognition using discriminant locality preserving projections[J]. Image and Vision Computing, 2006, 24(3): 239-248.
[11] 黃璞, 唐振民. 最小距离鉴别投影及其在人脸识别中的应用[J]. 中国图象图形学报, 2013, 18(02): 201-206.
Huang Pu, Tang Zhenmin. Minimum-distance discriminant projection and its application to face recognition[J]. Journal of Image and Graphics, 2013, 18(02): 201-206.
[12] 黄璞, 唐振民. 鉴别的局部中值保持投影及其在人脸识别中的应用[J]. 计算机辅助设计与图形学学报, 2012, 24(11): 1420-1425.
Huang Pu, Tang Zhenmin. Discriminant local median preserving projections with its application to face recognition[J]. Journal of Computer-Aided Design & Computer Graphics, 2012, 24(11): 1420-1425.
[13] Gou J, Yi Z, Du L, et al. A local mean-based k-nearest centroid neighbor classifier[J]. The Computer Journal, 2012, 55(9): 1058-1071. [14] 曾勇, 杨煜普, 赵亮. 基于局部均值与类均值的近邻分类[J]. 控制与决策, 2009, 24(04): 547-550.
Zeng Yong, Yang Yupu, Zhao Liang. Nearest neighbor classification based on local mean and class mean[J]. Control and Decision, 2009, 24(04): 547-550.
[15] 張晓涛, 唐力伟, 王平, 等. 基于半监督PCA-LPP流形学习算法的故障降维辨识[J]. 中南大学学报(自然科学版), 2016, 47(05): 1559-1564.
ZHANG Xiaotao, TANG Liwei, WANG Ping, et al. Fault identification and dimensionality reduction method based on semi-supervised PCA-LPP manifold learning algorithm[J]. Journal of Central South University (Science and Technology), 2016, 47(05): 1559-1564.
[16] BLAKE C L, MERZ C J, 1998, UCI repository of machine learning databases[EB/OL]. [2019-01-12] University of California. Available online at: http://archive.Ics.Uci. edu/ml/.
[17] 苏祖强, 汤宝平, 姚金宝. 基于敏感特征选择与流形学习维数约简的故障诊断[J]. 振动与冲击, 2014, 33(03): 70-75.
SU Zu-qiang, Tang Bao-ping, Yao Jin-bao. Fault diagnosis based on sensitive feature selection and manifold learning dimension reduction[J]. Journal of Vibration and Shock, 2014, 33(03): 70-75.
[18] 李学军,李平,蒋玲莉.类均值核主元分析法及在故障诊断中的应用[J]. 机械工程学报, 2014, 50(03): 123-129.
LI Xue-Jun, LI Ping, Jiang Ling-Li. Class mean kernel principal component analysis and its application in fault diagnosis[J]. Journal of Mechanical Engineering, 2014, 50(03): 123-129.
[19] Chen F, Tang B, Chen R. A novel fault diagnosis model for gearbox based on wavelet support vector machine with immune genetic algorithm[J]. Measurement, 2013, 46(1): 220-232.
[20] 赵孝礼, 赵荣珍. 全局与局部判别信息融合的转子故障数据集降维方法研究[J]. 自动化学报, 2017, 43(04): 560-567.
Zhao Xiao-li, Zhao Rong-zhen. A method of dimension reduction of rotor faults data set based on fusion of global and local discriminant information[J]. Acta Automatica Sinica, 2017, 43(04): 560-567.
Dimensional reduction analysis of rotating machinery fault data based on local centroid mean minimum-distance discriminant projection
SHI Ming-kuan, ZHAO Rong-zhen
(School of Mechanical and Electronical Engineering, Lanzhou University of Technology, Lanzhou 730050, China)
Abstract: Aiming at the problem of classification difficulty caused by the strong nonlinearity and the high dimensionality of fault dataset of rotating machinery, a fault dataset dimension reduction algorithm local centroid mean minimum-distance discriminant projection (LCMMDP) is proposed. The algorithm can maintain the local geometric structure information of the sample while considering the cohesion and separation of the sample, reflecting the close relationship between the sample and the local centroid mean. The hybrid characteristics of rotor vibration signals are extracted from multiple angles, the original high-dimensional feature sets are constructed, and low-dimensional sensitive feature subsets are extracted by LCMMDP. The improved k-nearest centroid neighbor classification based on local mean and class mean is used (KNCNCM) for fault pattern recognition. The proposed method integrates the advantages of LCMMDP in dimension reduction and KNCNCM in pattern recognition and provides higher fault identification accuracy. The validity of the proposed method is verified by the instance of the fault diagnosis of a double-span rotor system dataset and simulation dataset.
Key words: fault diagnosis; dimension reduction; local centroid mean; classifier; pattern recognition
作者简介: 石明宽 (1993-),男,硕士研究生。电话:18809490031;E-mail: 1937787272@qq.com
通讯作者: 赵荣珍 (1960-),女,教授,博士生导师。电话:13619349619;E-mail: zhaorongzhen@lut.cn
关键词: 故障诊断; 降维; 局部质心均值; 分类器; 模式识别
中图分类号: TH 165+3; TN911.7 文献标志码: A 文章编号: 1004-4523(2021)02-0421-10
DOI:10.16385/j.cnki.issn.1004-4523.2021.02.023
引 言
旋转机械在现代机电系统中起着至关重要的作用,因此对旋转机械进行状态监测和故障诊断具有极其重要的意义[1]。为了尽可能多地获取故障信息,通常采用多个传感器进行多通道的监测,提取出每个通道的多域故障特征,必不可避免地导致了大量的冗余信息和高度相关的信息形成的“维数灾难”问题[2]。因此,如何消除高维数据中的冗余信息,使通过积累获得的海量故障数据资源拥有开发利用的价值,已成为当今机械信息技术所面临的基本问题。
伴随着大数据技术的快速发展,数据降维已成为数据科学研究领域关注的热点问题。典型的降维算法包括主成分分析(Principal Component Analysis,PCA)[3]与线性鉴别分析(Linear Discriminant Analysis,LDA)[4]等。其中,PCA试图寻找一个最大协方差线性投影矩阵,LDA通过最大化类间散度的同时最小化类内散度,寻找一个最佳投影矩阵;而PCA和LDA都是基于整体样本结构的降维算法,无法表征样本的局部流形结构。针对此问题,相关研究提出了流形学习算法,如局部保持投影(Locality Preserving Projection,LPP)[5]、局部线性嵌入(Locally Linear Embedding,LLE)[6]等算法。LPP是对传统拉普拉斯特征映射算法(Laplacian Eigenmap,LE)[7]进行线性化近似的结果,通过线性化之后的LPP能够以较小的计算损耗获取比较好的数据聚类效果。但LPP仅考虑了样本的局部结构,忽略了有利于分类的类别信息,无法更多地挖掘出高维数据的几何结构信息。针对这种不利的局面,将LDA与LPP算法的优势进行集成,提出了诸多改进算法,如局部Fisher判别分析(Local Fisher Discriminant Analysis,LFDA)[8]、边缘Fisher分析(Marginal Fisher Analysis,MFA)[9]、鉴别局部保持投影(Discriminant Locality Preserving Projection,DLPP)[10]、最小鉴别投影(Minimum?distance Discriminant Projection,MDP)[11]等算法。MDP通过引入类间相似度与类内相似度,不仅描述了样本与类中心的距离关系,同时反映出类间距与类内距的大小关系。但MDP和LDA在高维小样本问题中采用类均值会导致数据特征信息的丢失,不能更好地反映样本类信息[12];另外MDP只考虑了样本与类中心之间的距离关系,忽视了样本点之间的局部近邻关系,无法有效地表征样本集的局部几何信息。针对MDP算法的局限性,本研究提出一种基于局部质心均值最小距离鉴别投影LCMMDP算法。LCMMDP利用样本与其近质心近邻点的均值间的距离设计了与MDP不同的相似性度量机制,欲从流形局部学习的角度重新定义局部类间相似度和局部类内相似度,充分利用了所有样本的局部几何信息和类别信息;另外,LCMMDP在计算过程中利用近质心近鄰点的均值,能够有效地抑制噪声数据对流形学习的干扰,提高算法的鲁棒性。
为实现利用LCMMDP降维后得到的低维敏感特征矢量与故障类型间的准确识别,需选择一种精度高、稳定性好的分类器。基于局部均值的k?近质心近邻(Local Mean?based k?nearest Centroid Neighbor,LMKNCN)分类算法是Gou等[13]为克服离群点对分类性能的负面影响而提出的非参数分类器,其基本思想是用待测样本点到每一类的局部质心均值点的距离大小来指定待测样本的类别。LMKNCN只利用了未分类样本在每类里的近邻的局部均值信息,与类可分离性密切相关的类均值特性并未利用。针对上述问题,根据文献[14]的思想,本研究提出一种基于局部均值与类均值的k?近质心近邻分类方法KNCNCM,在类均值互不相同的情况下,既利用未分类样本在每类里的近质心近邻的局部均值信息,又利用类均值的整体信息进行分类的想法,可以提高LMKNCN的分类性能。
基于上述分析,本研究对LCMMDP与KNCNCM相结合的转子故障数据集降维和分类方法进行探讨,欲从海量数据中挖掘更充分的数据结构信息,为智能故障模式识别技术的发展提供了一种理论参考依据。
5.2.1 参数设定
5.2.2 特征数据集的可分性分析 为了验证本文所提LCMMDP算法的可行性,选择与LPP,LDA,MMC,MNMP,MDP等降维算法进行比较。并将6种算法记为A1,A2,A3,A4,A5,A6。前三个主元的低维嵌入结果如图5所示(图中“◇”、“*”、 “☆”、“?”、“○”分别代表转子不对中、质量不平衡、动静碰摩、轴承座松动和正常状态)。
从图5可以看出,LPP的聚类效果最差,其中质量不平衡、动静碰摩、轴承座松动和正常状态四类特征之间离的较近,不易区分;MMC,MNMP的同类特征太过分散,类内距离过大;LCMMDP的聚类效果最好,不同类型特征之间完全分离,各类数据清晰可见,相同类型聚集成团;LPP,LDA,MMC,MNMP,MDP五种算法的不同类型特征之间都存在着一定的混叠,无法有效地区分。
为了进一步说明本文所提LCMMDP算法的可行性,考察降维后的特征集的可分性,引入类间类内距离的可分性参数[18]对测试样本集的分类与聚类程度给予量化评价。设降维后的低维特征子集的C类样本数据为特征集的类间距离、类内距离和可分性参数分别定义为:
由定义可知,类间距Sb反映了各类别之间的分离度,类内距Sw体现了每类样本分布的紧凑程度。低维空间特征集的类间距离越大,类内距离越小,则可分性参数值ρ就越大,特征集的可分性就越好。
按式(20)计算各降维算法降维后的特征集可分性参数值,如表3所示。从表3可以看出,MMC特征集的可分性参数最小,只有12.4167;LCMMDP特征集的可分性参数最大,可高达100.3742。综合图5和表3可知,相比于其他5种降维算法,LCMMDP聚类效果最好,可分性参数最大,说明LCMMDP具有较好的降维效果,在维数约简中有明显的优势。
5.2.3 故障分类效果
为了量化6种降维算法的降维效果,将各个算法降维后的低维敏感特征集输入KNCNCM分类器中进行故障模式识别,得到的识别率如表4所示。
结合表3和表4可以看出:①LPP的识别准确率最低,这是因为LPP是无监督算法,只侧重于局部几何结构信息的提取,而没有考虑类判别信息,导致故障特征解耦不完全,故障特征间仍存在混叠。②LDA,MMC,MNMP相较于LPP的识别率较好,是因为这三种算法均利用了样本的类判别信息,同时考虑了样本的分离性和内聚性。然而,LDA,MMC主要侧重于分析类判别信息,忽视了样本集的局部几何结构信息,导致大量的有用故障特征信息丢失;MMC,MNMP因为不存在小樣本问题,没有利用PCA预维数约简处理,因此无法有效的除去空间中的噪声和冗余信息,导致提取的特征信息无法有效识别故障类别,同时降低了特征集的可分性。③LCMMDP的识别准确率要远高于MDP及其他四种降维算法,是因为LCMMDP将样本的局部几何信息有效地融入到维数约简过程,实现了类判别信息与样本集局部几何结构信息的有效结合。另外,LMMDP利用了局部质心均值,有效地克制了原始特征信息的丢失,一定程度上抑制噪声数据对算法的影响,在挖掘故障样本数据集中蕴含的故障信息的同时实现对故障的有效解耦,可得到最有辨识力的低维特征子集,提高故障特征集的可分性。
为了进一步验证LCMMDP算法的适用性,本文在选取不同的训练样本数量和测试样本数量的情况下,上述6种算法降维得到的低维敏感特征经KNCNCM分类器进行故障模式识别的结果如图6所示。
图6表明,整体上各降维算法的识别准确率都随训练样本的增加而增加。由于LCMMDP充分利用了所有样本的局部几何信息和类别信息,故识别准确率一直较高,稳定性最好;LPP是无监督算法,在少量训练样本情况下,无法有效地保持局部结构信息,识别准确率较低;MMC是一种基于样本整体结构的降维算法,随着样本数量的不足,局部结构信息比全局结构信息更为重要,无法充分地利用样本信息,导致故障诊断效果下降,识别准确率低。
为了提高本研究所提LCMMDP算法的泛化能力,将不同算法在不同转速(分别为2800,3000,3200 r/min)下降维得到的低维特征子集输入KNCNCM分类器中进行故障识别,得到的平均识别准确率如图7所示。由图7可以看出,在不同转速下,LCMMDP降维方法的平均识别准确率都明显优于其他5种降维方法,表明它具有良好的适用性和更高的故障识别精度。
5.2.4 LCMMDP算法的抗干扰能力分析
为了分析LCMMDP的抗干扰能力,将系数γ=0.1,0.2,0.3,0.4的rand随机干扰噪声加入到原始故障集中[19?20],经上述6种算法降维后得到低维特征集,然后输入KNCNCM分类器进行故障识别,得到的识别准确率如图8所示。由图可知,随着干扰系数的增加,6种算法的准确率都有所降低,但LCMMDP降低的速率较慢,且准确率都明显高于其他算法。因此可以看出LCMMDP的抗干扰能力强,相应的鲁棒性较好。
5.2.5 KNCNCM分类器的性能分析
为了验证本文所提KNCNCM分类器的鲁棒性和稳定性,向测试故障集中融入系数为a=0.1,0.2,0.3,0.4的随机干扰噪声,将经LCMMDP降维后的低维敏感特征集输入KNCNCM,LMKNCN,KNN分类器中进行故障模式识别,得到的平均识别率如表5所示。
由表5中可以看出,LMKNCN的识别率高于KNN,原因是KNN的分类性能容易受到噪声干扰和离群点的影响,而LMKNCN利用每类训练样本集里未分类样本的几个近邻的局部均值信息,一定程度上克服了离群点对分类性能的影响;随着噪声的增多,KNCNCM的诊断结果变化较小,平均识别率都高于其他两种分类器,表明KNCNCM相较于LMKNCN和KNN对噪声不敏感,具有优异的稳定性和识别能力。
6 结 论
为使提取的旋转机械故障特征有利于实施故障数据集分类,本研究提出一种基于局部质心均值最小距离鉴别投影(LCMMDP)降维方法和基于局部均值与类均值的k?近质心近邻分类方法(KNCNCM)相结合的旋转机械故障诊断方法。分别通过一个双转子系统的振动信号集合和仿真数据集进行验证,实验结果表明: (1) LCMMDP相比较于MDP,MNMP,LDA,LPP,MMC等降维方法,可提取出可分性更高的低维空间故障特征集,在进行故障模式识别时具有一定的优势。
(2) KNCNCM分类方法既利用未分类样本在每类里的近质心近邻的局部信息,又利用了类均值的整体知识,克服了数据离群点对分类性能的影响,而且一定程度上避免了噪声的干扰,具有一定的稳定性和准确性。
(3) LCMMDP与KNCNCM相结合的维数约简故障诊断模式能够有效地对高维转子故障数据集进行维数约简和故障分类,为旋转机械智能故障诊断提供了一种解决方案。
参考文献:
[1] Wang Z Y, Lu C, Zhou B. Fault diagnosis for rotary machinery with selective ensemble neural networks[J]. Mechanical Systems and Signal Processing, 2018, 113: 112-130.
[2] SU Z, Tang B, MA J, et al. Fault diagnosis method based on incremental enhanced supervised locally linear embedding and adaptive nearest neighbor classifier[J]. Measurement, 2014, 48(1): 136-148.
[3] Turk M, Pentland A. Eigenfaces for recognition[J]. Journal of Cognitive Neuroscience, 1991, 3(1):71-86.
[4] Martinez A M, Kak A C. PCA versus LDA[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2001, 23(2): 228-233.
[5] He X. Locality preserving projections[J]. Advances in Neural Information Processing System, 2003, 16(1): 186-197.
[6] ROWEIS S T,SAUL L K. Nonlinear dimensionality reduction by locally linear embedding[J]. Science, 2000, 290(5500): 2323-2326.
[7] JIANG Quansheng,JIA Minping,HU Jianzhong, et al. Modified Laplacian eigenmap method for fault diagnosis[J]. Chinese Journal of Mechanical Engineering, 2008, 21(3): 90-93.
[8] Sugiyama M. Dimensionality reduction of multimodal labeled data by local fisher discriminant analysis[J]. Journal of Machine Learning Research, 2007, 8(1): 1027-1061.
[9] Yan S C, Xu D, Zhang B Y, et al. Graph embedding and extensions: A general framework for dimensionality reduction[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(1): 40-51.
[10] Yu W, Teng X, Liu C. Face recognition using discriminant locality preserving projections[J]. Image and Vision Computing, 2006, 24(3): 239-248.
[11] 黃璞, 唐振民. 最小距离鉴别投影及其在人脸识别中的应用[J]. 中国图象图形学报, 2013, 18(02): 201-206.
Huang Pu, Tang Zhenmin. Minimum-distance discriminant projection and its application to face recognition[J]. Journal of Image and Graphics, 2013, 18(02): 201-206.
[12] 黄璞, 唐振民. 鉴别的局部中值保持投影及其在人脸识别中的应用[J]. 计算机辅助设计与图形学学报, 2012, 24(11): 1420-1425.
Huang Pu, Tang Zhenmin. Discriminant local median preserving projections with its application to face recognition[J]. Journal of Computer-Aided Design & Computer Graphics, 2012, 24(11): 1420-1425.
[13] Gou J, Yi Z, Du L, et al. A local mean-based k-nearest centroid neighbor classifier[J]. The Computer Journal, 2012, 55(9): 1058-1071. [14] 曾勇, 杨煜普, 赵亮. 基于局部均值与类均值的近邻分类[J]. 控制与决策, 2009, 24(04): 547-550.
Zeng Yong, Yang Yupu, Zhao Liang. Nearest neighbor classification based on local mean and class mean[J]. Control and Decision, 2009, 24(04): 547-550.
[15] 張晓涛, 唐力伟, 王平, 等. 基于半监督PCA-LPP流形学习算法的故障降维辨识[J]. 中南大学学报(自然科学版), 2016, 47(05): 1559-1564.
ZHANG Xiaotao, TANG Liwei, WANG Ping, et al. Fault identification and dimensionality reduction method based on semi-supervised PCA-LPP manifold learning algorithm[J]. Journal of Central South University (Science and Technology), 2016, 47(05): 1559-1564.
[16] BLAKE C L, MERZ C J, 1998, UCI repository of machine learning databases[EB/OL]. [2019-01-12] University of California. Available online at: http://archive.Ics.Uci. edu/ml/.
[17] 苏祖强, 汤宝平, 姚金宝. 基于敏感特征选择与流形学习维数约简的故障诊断[J]. 振动与冲击, 2014, 33(03): 70-75.
SU Zu-qiang, Tang Bao-ping, Yao Jin-bao. Fault diagnosis based on sensitive feature selection and manifold learning dimension reduction[J]. Journal of Vibration and Shock, 2014, 33(03): 70-75.
[18] 李学军,李平,蒋玲莉.类均值核主元分析法及在故障诊断中的应用[J]. 机械工程学报, 2014, 50(03): 123-129.
LI Xue-Jun, LI Ping, Jiang Ling-Li. Class mean kernel principal component analysis and its application in fault diagnosis[J]. Journal of Mechanical Engineering, 2014, 50(03): 123-129.
[19] Chen F, Tang B, Chen R. A novel fault diagnosis model for gearbox based on wavelet support vector machine with immune genetic algorithm[J]. Measurement, 2013, 46(1): 220-232.
[20] 赵孝礼, 赵荣珍. 全局与局部判别信息融合的转子故障数据集降维方法研究[J]. 自动化学报, 2017, 43(04): 560-567.
Zhao Xiao-li, Zhao Rong-zhen. A method of dimension reduction of rotor faults data set based on fusion of global and local discriminant information[J]. Acta Automatica Sinica, 2017, 43(04): 560-567.
Dimensional reduction analysis of rotating machinery fault data based on local centroid mean minimum-distance discriminant projection
SHI Ming-kuan, ZHAO Rong-zhen
(School of Mechanical and Electronical Engineering, Lanzhou University of Technology, Lanzhou 730050, China)
Abstract: Aiming at the problem of classification difficulty caused by the strong nonlinearity and the high dimensionality of fault dataset of rotating machinery, a fault dataset dimension reduction algorithm local centroid mean minimum-distance discriminant projection (LCMMDP) is proposed. The algorithm can maintain the local geometric structure information of the sample while considering the cohesion and separation of the sample, reflecting the close relationship between the sample and the local centroid mean. The hybrid characteristics of rotor vibration signals are extracted from multiple angles, the original high-dimensional feature sets are constructed, and low-dimensional sensitive feature subsets are extracted by LCMMDP. The improved k-nearest centroid neighbor classification based on local mean and class mean is used (KNCNCM) for fault pattern recognition. The proposed method integrates the advantages of LCMMDP in dimension reduction and KNCNCM in pattern recognition and provides higher fault identification accuracy. The validity of the proposed method is verified by the instance of the fault diagnosis of a double-span rotor system dataset and simulation dataset.
Key words: fault diagnosis; dimension reduction; local centroid mean; classifier; pattern recognition
作者简介: 石明宽 (1993-),男,硕士研究生。电话:18809490031;E-mail: 1937787272@qq.com
通讯作者: 赵荣珍 (1960-),女,教授,博士生导师。电话:13619349619;E-mail: zhaorongzhen@lut.cn