论文部分内容阅读
随着智慧矿山建设的持续推进,煤矿企业积累了海量的监测数据,这些数据主要来源于矿井的采煤、掘进、机电、运输、通风等生产环节。矿井瓦斯监测数据中存在大量异常数据,目前矿井监控系统并不能有效区分,仅依据预设的瓦斯浓度阀值指标进行临灾预警,存在一定风险。对瓦斯异常值检测与预警展开了深入研究,主要研究内容如下:(1)针对瓦斯大数据建模效率低下的问题,提出了基于数据抽样优化的逻辑回归(Data Sampling Optimization Logistic Regression,DSO-LR)瓦斯异常值检测方法。首先,应用拉格朗日插补方法,对采集到的矿井瓦斯及其相关数据的缺失值进行插补,并标定异常数据。其次,依据概率抽样原理,通过比较不同抽样概率和全数据情况下建立的逻辑回归方程的欧式距离,确定最优抽样概率。最后,依据训练集建立回归方程的决策边界,并以该边界进行异常值检测。实验结果表明,DSO-LR确定的最优抽样概率为20%,DSO-LR相较于LR方法计算效率提高了 5倍,异常值识别率85%。(2)针对K-Means算法对初始簇心比较敏感的问题,提出了基于初始簇心优化的K-Means瓦斯异常值检测方法。首先,分析了不同监测位置之间瓦斯浓度数据的相关性。其次,依据采煤工序具有周期性的特点,基于前序数据的聚类簇心,优化后序数据的初始簇心,采用最小化每个类簇的方差作为类内数据相似性度量条件;最后,利用改进后的K-Means算法在实验数据上进行异常值检测。实验表明,改进的K-Means算法减少了迭代次数,提高了异常值检测的准确度。(3)为了实现瓦斯险情的分级预警,在分析异常数据之间关联性的基础上,构建了基于权值优化的 Apriori 关联规则的(Gas early warning model of Weight Optimization Apriori,WO-Apriori)瓦斯险情预警模型。首先,将前述算法检测出的瓦斯浓度及相关监测异常数据二元化,构建关联规则的学习集。其次,计算学习集的支持度,寻找高频项集。再次,在基于权值优化的最小置信度的条件下,从高频项集中产生关联规则。最后,依据关联规则,设计分级预警机制,从而判断异常数据的有效性,实现瓦斯事故隐患分级预警。实验结果表明:依据分级预警机制,对检测出的131条异常记录,其中38条记录属于粗大噪声,不需要预警;34条记录属于低级风险,17条记录属于中级风险,42记录属于高级风险,需要对应级别的预警。预警结果与专家分析结果一致,表明了WO-Apriori模型预警的有效性。