论文部分内容阅读
摘要: 针对不均衡数据下的轴承故障检测问题,提出一种最大软间隔支持向量域描述(Maximum Soft Margin Support Vector Domain Description,MSM-SVDD)故障检测模型。该模型通过引入最大软间隔正则项,将传统支持向量域描述(SVDD)算法的分类边界向故障类偏移,进而提高算法的故障检测性能,同时对正则化项系数的取值范围进行了理论分析。实验部分讨论了正则化项系数、高斯核参数以及正常类样本数目对模型故障检测性能的影响,并给出了正则化项系数与高斯核参数的取值建议。实验结果表明,新提出的MSM-SVDD模型非常适合处理小样本不均衡数据下的故障检测问题。最后通过实测数据的对比实验,表明MSM-SVDD模型在不均衡数据下的故障检测性能较其他方法有较大幅度提升。
关键词: 故障检测; 轴承; 不均衡数据; 最大软间隔; 支持向量域描述
中图分类号: TH163+.3; TH133.3 文献标志码: A 文章编号: 1004-4523(2019)04-0718-12
DOI:10.16385/j.cnki.issn.1004-4523.2019.04.020
引 言
在工业领域中,旋转机械是应用最为广泛的一类机械设备,例如:汽轮机、压缩机和传送带等。轴承作为旋转机械设备的重要组成部分,其工况直接影响整个旋转机械设备的运行状态。因此开展轴承早期故障检测研究具有十分重要的现实意义[1]。
振动信号分析方法[2]由于操作简单,设备研发耗费成本较低且优于其他方法,因此在当前大型旋转机械设备轴承故障检测中得到广泛采用。在振动信号分析方法中,包络分析[3]是一种常用的振动信号处理技术,其主要包括HHT[4],EMD[5]和 EEMD[6]等方法。但是受振源复杂、背景噪声随机以及频谱混叠等因素的影响,上述方法的检测效果并不理想[7]。近年来,随着人工智能技术的迅速发展,智能化已成为故障检测技术的重要发展方向,而机器学习是提高故障检测系统智能水平的主要途径[8]。其中,作为机器学习方法典型代表的支持向量机(Support Vector Machine, SVM)算法,因其良好的非线性区分能力被广泛应用于机械系统的故障检测[9]。但是在实际大型旋转机械设备故障检测应用中故障类训练样本是不易获取的,从而导致正常类训练样本与故障类训练样本间数目不均衡。受不均衡数据的影响,SVM算法的检测性能严重下降[10]。因此如何在不均衡数据下提高SVM算法的故障检测性能成为了众多学者关注的重点。近些年,相继提出了各种处理不均衡数据故障检测的SVM改进算法。其中,代价敏感(Cost-sensitivity SVM, CSSVM)学习方法[11]通过把各类不同错分代价应用到分类决策中去对SVM进行改造,尽可能地降低了错误分类的整体代价;然而因受等式约束限制,算法性能的提升并不明显[12]。后来提出的基于边界人工少数类过取样技术(Border Synthetic Minority Over-sampling Technique, BSMOTE)的代价敏感SVM[13]算法和基于BSMOTE过取样集成SVM (Ensemble SVM, ESVM)[14]算法虽在一定程度上降低了样本数据的非平衡度,但是上述算法均是利用已有正常类样本信息增加规模,容易导致在样本增加的同时决策域减小,算法过度拟合,从而降低故障检测精度[15]。为此,学者们将目光投向与SVM原理相似的支持向量域描述(Support Vector Domain Description, SVDD)[16]算法。由于SVDD训练时不需要故障类样本,因此较SVM更適合不均衡数据下的轴承故障检测问题[17]。然而正是因为SVDD没能考虑到少数故障类样本信息对决策边界的影响,使得优化后的决策边界紧靠正常类样本一侧,导致算法的故障检测性能不高。事实上,在实际不均衡数据故障检测应用中,虽然难获取,但仍可以收集到少数故障类样本。为了能利用少数故障样本改善分类界面,学者们提出带故障类样本信息的支持向量域描述(Support Vector Domain Description with Negative Samples, SVDD –NEG)[18]算法,该算法通过对正常类和少数故障类中的错分样本增加惩罚项来提高算法的泛化性能。然而正如上文所述,故障样本虽然存在但数量较少,在这种极端不均衡情况下,故障类样本与正常类样本混叠概率较低,因此,在实际故障检测应用中通常要解决的是不均衡数据的可分问题。由于SVDD-NEG采用的是对两类样本集的错分总和进行惩罚来调整分类边界,当面对可分问题时,两类样本集错分总和通常为零,这时惩罚项将无法起到调整分类边界的作用。
为此,本文在借鉴传统SVM算法分类间隔最大化思想基础上,对SVDD的优化目标进行改进,通过增加正常类与故障类样本间的最大软间隔正则项[19],实现调整分类边界的作用。在此基础上提出一种基于最大软间隔SVDD轴承故障检测模型。该模型通过充分利用少数故障类样本信息,将分类边界向故障类偏移,进而提高模型处理不均衡数据的故障检测性能。实验部分将本文方法同其他方法进行比较,结果表明本文方法在数据不均衡情况下的轴承故障检测性能较其他方法有较大幅度提高。
关键词: 故障检测; 轴承; 不均衡数据; 最大软间隔; 支持向量域描述
中图分类号: TH163+.3; TH133.3 文献标志码: A 文章编号: 1004-4523(2019)04-0718-12
DOI:10.16385/j.cnki.issn.1004-4523.2019.04.020
引 言
在工业领域中,旋转机械是应用最为广泛的一类机械设备,例如:汽轮机、压缩机和传送带等。轴承作为旋转机械设备的重要组成部分,其工况直接影响整个旋转机械设备的运行状态。因此开展轴承早期故障检测研究具有十分重要的现实意义[1]。
振动信号分析方法[2]由于操作简单,设备研发耗费成本较低且优于其他方法,因此在当前大型旋转机械设备轴承故障检测中得到广泛采用。在振动信号分析方法中,包络分析[3]是一种常用的振动信号处理技术,其主要包括HHT[4],EMD[5]和 EEMD[6]等方法。但是受振源复杂、背景噪声随机以及频谱混叠等因素的影响,上述方法的检测效果并不理想[7]。近年来,随着人工智能技术的迅速发展,智能化已成为故障检测技术的重要发展方向,而机器学习是提高故障检测系统智能水平的主要途径[8]。其中,作为机器学习方法典型代表的支持向量机(Support Vector Machine, SVM)算法,因其良好的非线性区分能力被广泛应用于机械系统的故障检测[9]。但是在实际大型旋转机械设备故障检测应用中故障类训练样本是不易获取的,从而导致正常类训练样本与故障类训练样本间数目不均衡。受不均衡数据的影响,SVM算法的检测性能严重下降[10]。因此如何在不均衡数据下提高SVM算法的故障检测性能成为了众多学者关注的重点。近些年,相继提出了各种处理不均衡数据故障检测的SVM改进算法。其中,代价敏感(Cost-sensitivity SVM, CSSVM)学习方法[11]通过把各类不同错分代价应用到分类决策中去对SVM进行改造,尽可能地降低了错误分类的整体代价;然而因受等式约束限制,算法性能的提升并不明显[12]。后来提出的基于边界人工少数类过取样技术(Border Synthetic Minority Over-sampling Technique, BSMOTE)的代价敏感SVM[13]算法和基于BSMOTE过取样集成SVM (Ensemble SVM, ESVM)[14]算法虽在一定程度上降低了样本数据的非平衡度,但是上述算法均是利用已有正常类样本信息增加规模,容易导致在样本增加的同时决策域减小,算法过度拟合,从而降低故障检测精度[15]。为此,学者们将目光投向与SVM原理相似的支持向量域描述(Support Vector Domain Description, SVDD)[16]算法。由于SVDD训练时不需要故障类样本,因此较SVM更適合不均衡数据下的轴承故障检测问题[17]。然而正是因为SVDD没能考虑到少数故障类样本信息对决策边界的影响,使得优化后的决策边界紧靠正常类样本一侧,导致算法的故障检测性能不高。事实上,在实际不均衡数据故障检测应用中,虽然难获取,但仍可以收集到少数故障类样本。为了能利用少数故障样本改善分类界面,学者们提出带故障类样本信息的支持向量域描述(Support Vector Domain Description with Negative Samples, SVDD –NEG)[18]算法,该算法通过对正常类和少数故障类中的错分样本增加惩罚项来提高算法的泛化性能。然而正如上文所述,故障样本虽然存在但数量较少,在这种极端不均衡情况下,故障类样本与正常类样本混叠概率较低,因此,在实际故障检测应用中通常要解决的是不均衡数据的可分问题。由于SVDD-NEG采用的是对两类样本集的错分总和进行惩罚来调整分类边界,当面对可分问题时,两类样本集错分总和通常为零,这时惩罚项将无法起到调整分类边界的作用。
为此,本文在借鉴传统SVM算法分类间隔最大化思想基础上,对SVDD的优化目标进行改进,通过增加正常类与故障类样本间的最大软间隔正则项[19],实现调整分类边界的作用。在此基础上提出一种基于最大软间隔SVDD轴承故障检测模型。该模型通过充分利用少数故障类样本信息,将分类边界向故障类偏移,进而提高模型处理不均衡数据的故障检测性能。实验部分将本文方法同其他方法进行比较,结果表明本文方法在数据不均衡情况下的轴承故障检测性能较其他方法有较大幅度提高。