论文部分内容阅读
船用燃气轮机是现代舰船上一种重要的主动力装置,其由于工作在盐雾侵蚀、海况多变的恶劣环境中,往往运行一段时间后会因为污染、热腐蚀、磨损等原因发生退化现象,进而削弱该设备的运行可靠性和船舶的推进性能。因此,及时预测出船用燃气轮机设备的退化情况将有助于实现该设备的视情维护,从而提升其运行性能。然而,船舶自动化系统采集到的样本大部分为正常运行数据,此时面向所有类型样本都足够多且标签已知的传统有监督算法便不可直接用于设备退化预测研究。另一方面,上述采集到的船舶设备运行数据集很可能会被少量未标记的异常样本和噪声样本等污染,进而削弱退化检测模型的预测效果。而单类支持向量机和孤立森林这两种单分类算法仅需要单类样本便可实现异常检测,其中孤立森林算法更对污染数据具有不错的包容能力。基于此,本文分别展开基于单类支持向量机(着重针对设备正常运行数据集)和孤立森林(着重针对设备污染数据集)两种单分类算法的船用燃气轮机退化检测研究。本文首先对该船用燃气轮机的退化数据集进行了预处理,剔除了不变的和线性相关的属性,并进行了数据归一化处理。与此同时,本文还构造了 40组污染比例从0到100%的污染数据集。经上述处理后,本文分别采用设备正常运行数据集和不同污染比例的设备污染数据集构造了多个单类支持向量机和孤立森林退化检测模型。同时,为了充分对比单类支持向量机和孤立森林退化检测模型的预测效果,本文采用网格优化算法分别对单类支持向量机算法的超参数n和核参数g以及孤立森林算法的孤立树数目T和子采样规模S进行了超参数优化。其中,Fei Tony Liu和周志华教授的原论文只为孤立森林算法的孤立树设置了几组超参数数值,本文为充分发挥该算法的潜力引入了基于网格搜索算法的超参数优化过程。实验证明,经设备正常运行数据训练的单类支持向量机退化检测模型在稳定工况下其测试准确度均可达95%以上,且各项其它评价指标良好。而孤立森林退化检测模型在污染数据比例达到20%时,其测试准确率、召回率、F1 score、AUC值仍可达0.9以上。由此可见,本文建立的单类支持向量机模型在退化检测上的优势在于:其可只需设备正常运行数据训练模型,大大降低了对数据的标记要求。另一方面,本文构造的基于孤立森林的退化检测模型,其优势在于:即使数据集中混有相当比例的未标记污染数据,该模型仍能保持较高的退化检测精度。因此,这两种单分类退化检测方法可互为补充,进而为船用燃气轮机等设备的视情维护提供决策支持。