论文部分内容阅读
矿井突水是煤矿生产中的重大灾害之一,其突发性和破坏性极强,具有事故发生频繁、危害程度大等特点,威胁着矿工的生命财产安全。由于煤层底板突水预测问题受自然环境、水文地质等多种复杂因素的影响,因此传统方法的预测效果并不理想。一些新兴的智能算法在平衡样本下进行突水预测,虽然取得了一定的效果。但在平衡样本下进行突水预测,仍存在一些问题。在现实中,突水事件远少于不突水事件,突水样本数量十分稀少,使样本集常处于不平衡状态。如果针对不突水事件的预测准确率较高,而对突水事件的预测准确率较低,将直接影响预测效果。因此,提高不平衡数据下少数类样本的预测精度是煤层底板突水预测领域内尚需解决的问题。 本文在充分研究传统方法和机器学习算法的基础上,针对煤层底板突水数据的特点,在不平衡数据下构建了基于K-means-Relief-HSMOTE-PSO-SVM的底板突水预测模型。首先,应用K-means法优化Relief方法,对底板突水指标进行筛选,以弥补Relief指标筛选方法导致突水特征权重值偏大的缺陷;其次,针对SMOTE方法在处理不平衡数据时出现的因噪声数据敏感、模糊正负类边界、插值空间过小导致过拟合等问题,提出h维空间的过采样算法(HSMOTE),使底板突水数据集趋于平衡;应用粒子群优化支持向量机(PSO-SVM)预测降维、平衡后的突水数据。最后,在Matlab平台上应用UCI数据库中的fertility、German数据集进行仿真实验,验证K-means-Relief-HSMOTE-PSO-SVM模型的可行性和准确性。 通过对华北典型煤矿实测样本进行分析,综合选取了六个煤层底板突水的主要影响因素,将其输入K-means-Relief-HSMOTE-PSO-SVM中试验50次,并与其他模型进行对比。结果表明:本文建立的煤层底板突水预测模型明显优于对比模型,所建模型能够提取关键突水特征因子,弥补SMOTE方法的缺陷,优化了SVM的参数选取,有效地提升了在不平衡数据下对少数类突水样本的预测精度和几何平均正确率。