论文部分内容阅读
摘 要:支持向量机SVM在机械故障诊断中得到了广泛的应用。SVM分类方法存在对模糊信息不可分,对训练样本内的噪声点和孤立点特别敏感,计算所需内存大等问题。针对以上问题,提出了一种基于二叉树的模糊支持向量机多分类算法(BTFSVM)。本文着重分析利用BTFSVM智能故障诊断理论,研究其在船舶轴承中的应用。通过仿真实验表明该算法有较好的抗干扰能力和分类效果。可进一步考虑推广到船舶上其它机械故障诊断中应用。
关键词:二叉树,模糊支持向量机,轴承,故障诊断
Abstract: Support vector machine SVM has been widely used in mechanical fault diagnosis. The SVM classification method of fuzzy information can not be divided, particularly sensitive to noise in the training samples and isolated points, the problem of memory, the required computation. In view of the above problems, and propose a classification algorithm based on Fuzzy Support Vector Machine Based on two binary tree (BTFSVM). This paper focuses on the analysis of the BTFSVM intelligent fault diagnosis theory, studies its application in ship of bearing. The simulation experiments show that the algorithm has good anti-jamming capability and classification performance. Can be considered further applied to ships of other mechanical fault diagnosis.
Keywords: two forks tree, fuzzy support vector machine, bearing, fault diagnosis
中图分类号:S851.34+4文献标识码:A文章编号:
0 引言
BTFSVM首先利用模糊聚类技术求取每类样本聚类中心,再对各聚类中心逐次二分,从而确定了一棵二叉树,然后在二叉树的每个节点处,根据样本聚类中心把相应样本分成两类,构造出SVM 子分类器。实验表明,对于k类别故障诊断问题,只需构造k-1个SVM 子分类器,简化了分类器结构,避免了不可区分区域的出现,且节省了内存开销,故障诊断正确率高。
轴承是各种旋转机械中应用最广泛的通用部件,它的好坏对机器的工作状况影响极大,对轴承故障信号的特征分析一直是研究的热点。数学形态变换是一种完全基于信号时域特征的非线形分析方法,不同的故障类型的信号具有不同的形态特征,形态谱曲线和形态谱熵是定量描述信号特征的形态学变量,将这些形态学变量作为BTFSVM的输入参数用于不同的故障模式的分类。实验数据分析表明形态特征及其它特征参数提取和BTFSVM相结合的方法用于船舶轴承的故障特征分析和类型识别是有效的。
1 模糊支持向量机(FSVM)
SVM本质上是一个两类划分问题,通常将n类问题转化为n个两分类问题来处理,可能存在着不可分区域。然而在现实应用中:要求每一个样本必须属于某一类;某些样本可能要比其他的样本重要,因此更需要那些重要样本被正确分类而不在意其他样本(例如噪声)是否被错分。本文尝试将模糊思想和SVM相结合,通过求解每个样本对各个类的模糊隶属度,解释支持向量机的学习结果,进一步优化其分类面。
对每一个样本引入了样本模糊隶属度。表示样本的重要性,或者样本属于某一类的可能性大小。引入了后,最优分类问题为
(1)
用來度量对具有不同重要性的样本错分的惩罚程度。引入Lagrange因子得到其对偶形式为:
, (2)
由此得到决策函数:(3)
对应于的支持向量(样本)位于超平面的距离处;而所对应的支持向量就是被错分的样本。
在具体的应用中,首先要依据训练数据的具体特征,确定样本的模糊隶属度的上下界,。然后再选择一个适当的隶属度函数,建立起样本与隶属度之间的联系。最后,根据FSVM 理论求出最优分类面和分类函数。按照模糊逻辑推理系统结构图,利用FSVM进行模糊诊断,结合人们多年的工作经验,便于准确的查找故障。
2轴承故障诊断
2.1特征参数值的提取
1) 时域统计特征及无量纲常数:时域统计指标分为两个部分,一部分是常用的有量纲特征值:最大值、最小值、峰峰值、均值和方差;另一部分无量纲的特征分析值:方根幅值、平均幅值、峭度、波形指标、峰值指标和裕度指标。有量纲的统计特征值进行振幅分析时,得到的结果不但与机电设备的状态有关,而且与机器的运行参数(转速、载荷等)有关;无量纲与机器运行状态基本无关,是一种较好的诊断参数。方差直接反映了振动能量的大小,峭度、幅值指标和脉冲指标反映了冲击能量大小。
2) 频域:功率谱和全息谱:一般工程上常用的方法是把振动信号频谱中若干个频段上不同频率的谱峰总量作为特征向量,比较常用的是6段频谱、9段频谱和8段频谱。
3) 通过对振动信号形状特征的分析,分别计算每种工况下信号的归一化形态谱熵值(S)和形态谱曲线重心尺度值(G)。本实验一组信号的计算结果如表1所示:
船舶轴承故障信号的形态谱熵值和形态谱曲线重心尺度值(S,G)
2.2 样本的选取
本实验以轴承无故障F1、内圈故障F2、外圈故障F3,滚动体单点点蚀故障F4,内外圈混合故障F5与内外圈和滚动体混合故障F6等六种情况分别进行测试。考虑额定负荷(100%MCR),部分负荷(90%MCR,75%MCR)和半负荷(50%MCR)四种工况。对应每种故障采集20个样本数据,共得到480个样本,将其中96个数据样本用于训练(含各类故障样本数4个),后384个数据样本作为检验样本。
通过实验比较采用6段频谱特征与时域指标中的方差(D)、峭度(Xq)、峰值指标(C)、波形指标K,脉冲指标(I),形态谱熵值(S),形态谱曲线重心尺度值(G)相结合的特征提取方法效果较好。即联合组成13维特征向量=[(0-0.49)f, 0.5f,(0.5-0.99)f, f, (3-5)f,>5f,D,Xq,C,K,I,S,G](f为振动频率)。这样不仅可以提取频域中的有用信息,又可以保留时域中的有效信息。
2.3 FSVM分类器参数的确定
关于如何设置SVM的各个参数,理论上还没有统一的论述,往往要针对待解决的实际问题,具体选择。在本文的故障诊断中采用RBF核函数:
(4)
式中是感知变量,其数值可以自由选择,它决定了该高斯函数围绕中心点的宽度。
模糊隶属度的选择:样本的模糊隶属度的下界的确定(参见文献(1))。将模糊隶属度视作时间的单调线性函数,即(6)
式中是数据采集的时刻,时间越靠后,数据越重要,即第一个样本的隶属度为,最后一个样本的隶属度。
2.4 BTFSVM训练算法在齿轮故障诊断中的应用如下:
对上述6个输出变量的每一个,都对应从采集的数据中取4个训练样本,支持向量机进行学习。另外取16个作为待分类测试样本。
1)确定训练样本的类型。设FSVM集合S={S1,S2,…,S6},其中Si是以Fi为正类训练样本,将其它的样本全部作为负训练样本。
2)选择训练样本,并构造可能支持向量样本集合D={D1,D2,…,Dm},Di= i=1,…,m, m6.
3)训练模糊支持向量机Fi。以D中的样本为训练样本,采用上述模糊隶属度度量方法,确定每个样本的隶属度,并利用序列最小最优化算法解决FSVM的规划问题,即求解式2
4)计算正确率:判断是否应该在D中加入新的样本。利用训练好的Fi按式3对训练样本分类,并计算分类正确率P,直到P=1
5)判断算法是否结束。如果c< k, c++,返回到第2步,否则训练结束。
6)对待分类测试样本进行分类。测试样本的分类效果图如下:
2.5仿真结果
为判断此方法的准确性,及与其它方法相比的优越性。本文利用BTFSVM和BTSVM两种故障诊断方法分别对大量故障样本进行诊断。诊断结果及误诊数目如下表2所示:
表2表明BTFSVM抗干扰能力强,对噪声点和孤立点能够准确进行分类,具有更好的分类效果。
3 结语
本文提出的BTFSVM多分类算法,预先提取模糊支持向量的方法,所以它与基于二叉树的支持向量机的多分类算法具有相似的分类效率;通过实验证明了该算法比基于二叉树的支持向量机多分类算法有更好的抗干扰能力和更好的分类效果。
对于本文采用的模糊隶属度度量方法中参数mi的选择还是依靠主观经验公式,而mi将直接影响到最后的分类效果,可见如何选择参数mi是下一步需要研究的问题;特征参数的选取也直接影响分类效果,怎样选择尽可能小的特征参数数目,减少计算量,达到同样准确的分类效果,甚至更好也是需要研究的问题。
参考文献:
[1] Chun-fu Lin and Sheng-de Wang. Fuzzy Support Vector Machines [J]. Ieee Transactions on Neural Networks, 2002, 13, (2): 464-471.
[2] Zhousuo Zhang and Qiao Hu. Fuzzy Support Vector Machine and Its Application to Mechanical Condition Monitoring [M]. Xi-an Jiaotong University.
[3] 鄧乃扬, 田英杰. 数据挖掘中的新方法[M]. 北京: 机械工业出版社, 2005.
关键词:二叉树,模糊支持向量机,轴承,故障诊断
Abstract: Support vector machine SVM has been widely used in mechanical fault diagnosis. The SVM classification method of fuzzy information can not be divided, particularly sensitive to noise in the training samples and isolated points, the problem of memory, the required computation. In view of the above problems, and propose a classification algorithm based on Fuzzy Support Vector Machine Based on two binary tree (BTFSVM). This paper focuses on the analysis of the BTFSVM intelligent fault diagnosis theory, studies its application in ship of bearing. The simulation experiments show that the algorithm has good anti-jamming capability and classification performance. Can be considered further applied to ships of other mechanical fault diagnosis.
Keywords: two forks tree, fuzzy support vector machine, bearing, fault diagnosis
中图分类号:S851.34+4文献标识码:A文章编号:
0 引言
BTFSVM首先利用模糊聚类技术求取每类样本聚类中心,再对各聚类中心逐次二分,从而确定了一棵二叉树,然后在二叉树的每个节点处,根据样本聚类中心把相应样本分成两类,构造出SVM 子分类器。实验表明,对于k类别故障诊断问题,只需构造k-1个SVM 子分类器,简化了分类器结构,避免了不可区分区域的出现,且节省了内存开销,故障诊断正确率高。
轴承是各种旋转机械中应用最广泛的通用部件,它的好坏对机器的工作状况影响极大,对轴承故障信号的特征分析一直是研究的热点。数学形态变换是一种完全基于信号时域特征的非线形分析方法,不同的故障类型的信号具有不同的形态特征,形态谱曲线和形态谱熵是定量描述信号特征的形态学变量,将这些形态学变量作为BTFSVM的输入参数用于不同的故障模式的分类。实验数据分析表明形态特征及其它特征参数提取和BTFSVM相结合的方法用于船舶轴承的故障特征分析和类型识别是有效的。
1 模糊支持向量机(FSVM)
SVM本质上是一个两类划分问题,通常将n类问题转化为n个两分类问题来处理,可能存在着不可分区域。然而在现实应用中:要求每一个样本必须属于某一类;某些样本可能要比其他的样本重要,因此更需要那些重要样本被正确分类而不在意其他样本(例如噪声)是否被错分。本文尝试将模糊思想和SVM相结合,通过求解每个样本对各个类的模糊隶属度,解释支持向量机的学习结果,进一步优化其分类面。
对每一个样本引入了样本模糊隶属度。表示样本的重要性,或者样本属于某一类的可能性大小。引入了后,最优分类问题为
(1)
用來度量对具有不同重要性的样本错分的惩罚程度。引入Lagrange因子得到其对偶形式为:
, (2)
由此得到决策函数:(3)
对应于的支持向量(样本)位于超平面的距离处;而所对应的支持向量就是被错分的样本。
在具体的应用中,首先要依据训练数据的具体特征,确定样本的模糊隶属度的上下界,。然后再选择一个适当的隶属度函数,建立起样本与隶属度之间的联系。最后,根据FSVM 理论求出最优分类面和分类函数。按照模糊逻辑推理系统结构图,利用FSVM进行模糊诊断,结合人们多年的工作经验,便于准确的查找故障。
2轴承故障诊断
2.1特征参数值的提取
1) 时域统计特征及无量纲常数:时域统计指标分为两个部分,一部分是常用的有量纲特征值:最大值、最小值、峰峰值、均值和方差;另一部分无量纲的特征分析值:方根幅值、平均幅值、峭度、波形指标、峰值指标和裕度指标。有量纲的统计特征值进行振幅分析时,得到的结果不但与机电设备的状态有关,而且与机器的运行参数(转速、载荷等)有关;无量纲与机器运行状态基本无关,是一种较好的诊断参数。方差直接反映了振动能量的大小,峭度、幅值指标和脉冲指标反映了冲击能量大小。
2) 频域:功率谱和全息谱:一般工程上常用的方法是把振动信号频谱中若干个频段上不同频率的谱峰总量作为特征向量,比较常用的是6段频谱、9段频谱和8段频谱。
3) 通过对振动信号形状特征的分析,分别计算每种工况下信号的归一化形态谱熵值(S)和形态谱曲线重心尺度值(G)。本实验一组信号的计算结果如表1所示:
船舶轴承故障信号的形态谱熵值和形态谱曲线重心尺度值(S,G)
2.2 样本的选取
本实验以轴承无故障F1、内圈故障F2、外圈故障F3,滚动体单点点蚀故障F4,内外圈混合故障F5与内外圈和滚动体混合故障F6等六种情况分别进行测试。考虑额定负荷(100%MCR),部分负荷(90%MCR,75%MCR)和半负荷(50%MCR)四种工况。对应每种故障采集20个样本数据,共得到480个样本,将其中96个数据样本用于训练(含各类故障样本数4个),后384个数据样本作为检验样本。
通过实验比较采用6段频谱特征与时域指标中的方差(D)、峭度(Xq)、峰值指标(C)、波形指标K,脉冲指标(I),形态谱熵值(S),形态谱曲线重心尺度值(G)相结合的特征提取方法效果较好。即联合组成13维特征向量=[(0-0.49)f, 0.5f,(0.5-0.99)f, f, (3-5)f,>5f,D,Xq,C,K,I,S,G](f为振动频率)。这样不仅可以提取频域中的有用信息,又可以保留时域中的有效信息。
2.3 FSVM分类器参数的确定
关于如何设置SVM的各个参数,理论上还没有统一的论述,往往要针对待解决的实际问题,具体选择。在本文的故障诊断中采用RBF核函数:
(4)
式中是感知变量,其数值可以自由选择,它决定了该高斯函数围绕中心点的宽度。
模糊隶属度的选择:样本的模糊隶属度的下界的确定(参见文献(1))。将模糊隶属度视作时间的单调线性函数,即(6)
式中是数据采集的时刻,时间越靠后,数据越重要,即第一个样本的隶属度为,最后一个样本的隶属度。
2.4 BTFSVM训练算法在齿轮故障诊断中的应用如下:
对上述6个输出变量的每一个,都对应从采集的数据中取4个训练样本,支持向量机进行学习。另外取16个作为待分类测试样本。
1)确定训练样本的类型。设FSVM集合S={S1,S2,…,S6},其中Si是以Fi为正类训练样本,将其它的样本全部作为负训练样本。
2)选择训练样本,并构造可能支持向量样本集合D={D1,D2,…,Dm},Di= i=1,…,m, m6.
3)训练模糊支持向量机Fi。以D中的样本为训练样本,采用上述模糊隶属度度量方法,确定每个样本的隶属度,并利用序列最小最优化算法解决FSVM的规划问题,即求解式2
4)计算正确率:判断是否应该在D中加入新的样本。利用训练好的Fi按式3对训练样本分类,并计算分类正确率P,直到P=1
5)判断算法是否结束。如果c< k, c++,返回到第2步,否则训练结束。
6)对待分类测试样本进行分类。测试样本的分类效果图如下:
2.5仿真结果
为判断此方法的准确性,及与其它方法相比的优越性。本文利用BTFSVM和BTSVM两种故障诊断方法分别对大量故障样本进行诊断。诊断结果及误诊数目如下表2所示:
表2表明BTFSVM抗干扰能力强,对噪声点和孤立点能够准确进行分类,具有更好的分类效果。
3 结语
本文提出的BTFSVM多分类算法,预先提取模糊支持向量的方法,所以它与基于二叉树的支持向量机的多分类算法具有相似的分类效率;通过实验证明了该算法比基于二叉树的支持向量机多分类算法有更好的抗干扰能力和更好的分类效果。
对于本文采用的模糊隶属度度量方法中参数mi的选择还是依靠主观经验公式,而mi将直接影响到最后的分类效果,可见如何选择参数mi是下一步需要研究的问题;特征参数的选取也直接影响分类效果,怎样选择尽可能小的特征参数数目,减少计算量,达到同样准确的分类效果,甚至更好也是需要研究的问题。
参考文献:
[1] Chun-fu Lin and Sheng-de Wang. Fuzzy Support Vector Machines [J]. Ieee Transactions on Neural Networks, 2002, 13, (2): 464-471.
[2] Zhousuo Zhang and Qiao Hu. Fuzzy Support Vector Machine and Its Application to Mechanical Condition Monitoring [M]. Xi-an Jiaotong University.
[3] 鄧乃扬, 田英杰. 数据挖掘中的新方法[M]. 北京: 机械工业出版社, 2005.