论文部分内容阅读
近年来,随着传感、通信及信息处理技术的不断发展,使得监控工业生产过程和设备状态成为可能,如何充分利用这些监控数据及时发现异常模式,避免事故发生,减少不必要的人员伤亡和经济损失显得尤为重要,因此,研究基于数据驱动的高效异常检测方法具有重要的理论意义和实用价值。本文结合煤层底板突水预测和输送带撕裂检测这2个异常检测应用的需求,从支持向量机的基本理论、算法构造和性能优化等方面进行了系统的分析和研究。首先,在异常检测中常常由于异常样本缺乏导致类别不平衡,本文选用支持向量数据描述(SVDD)一类分类方法和支持向量机(SVM)相结合进行异常检测和识别;然后,针对检测模型抗噪性和泛化性的改善、检测效率的提高以及模型的可在线更新等问题进行了重点研究。论文的主要创新工作包括以下内容:(1)构建了煤层底板突水预测和矿用输送带撕裂检测2个检测应用特征数据集。在煤层底板突水预测方面,首先,基于当前国内外对底板突水机理的研究,分析了影响底板突水发生的主要因素,参考当前已发表研究成果,构建了一个底板突水预测参考数据集;然后,针对山西西山晋兴能源某矿底板承压水突出预测问题,通过分析其水文地质资料及勘探数据,并经地质专家分析标注,构建了该矿的底板突水预测数据集。在输送带撕裂检测方面,首先,采用机器视觉方法获得输送带监测图像,然后进行中值滤波降噪,并根据输送带撕裂图像的特性,提取了灰度直方图和灰度共生矩阵2项特征,构建了输送带撕裂检测数据集。(2)针对svdd算法易受噪声干扰导致检测精度和泛化性能下降,通过引入基于切断距离局部密度惩罚权重来表征样本、特别是边界样本的分布特性,然后在带负类的svdd算法基础上,通过使用ε不敏感损失函数构造两类样本的间隔,提出了两种新的鲁棒性svdd方法,分别为r-svdd和εnr-svdd,并给出了其对应的理论分析,最后通过uci公共数据集、煤层底板突水预测数据集和输送带撕裂视觉特征数据集验证了提出方法具有较高的检测正确率,并提高了抗噪性和泛化性。(3)针对特征选择对异常检测模型构建的重要影响,提出了增强人工蜂群-支持向量机(eabc-svm)算法来实现有效的特征选择。在增强人工蜂群算法中,运用cat混沌映射进行种群初始化来提高种群多样性,运用提出的基于当前最优解的定向搜索方程来改善原始人工蜂群(abc)算法的全局优化能力和收敛速度。通过uci数据集、底板突水预测数据集和输送带撕裂视觉特征数据集上进行实验测试,并与原始abc及其他abc改进方法结合svm进行特征选择相比,eabc-svm方法用于异常检测特征选择中能够得到更高的分类正确率,同时可以消除特征数据中的冗余变量,从而提高异常检测的整体性能。(4)针对异常检测应用中,监测数据流往往动态变化,随着新样本增加,传统基于批数据处理的SVM分类模型不能有效更新,导致检测正确率下降。为了有效解决该问题,提出了基于广义KKT条件选择最优更新集的GKKT-ISVM增量学习算法,通过UCI数据集、底板突水预测数据集和输送带撕裂视觉特征数据集上的实验结果表明,所提算法可以有效利用先前训练结果,结合新增样本来快速更新检测模型,进而提高检测性能,满足动态数据流异常检测应用的要求。