论文部分内容阅读
矿山微震数据流的分类识别是煤矿安全监控中的重要环节,目前广泛使用的分类方法主要有人工识别方法和传统机器学习分类方法。但是,采用人工识别方法费时、费力并且难以保证分类准确率,而传统机器学习方法虽然一定程度上改善了人工识别的缺点,但是未考虑到微震信号数据实质上是一种特殊场景下的实时数据流,具有数据流易发生概念漂移现象的特点。另外,从监控系统中提取出来的原始微震信号数据存在高维度、时频变换的问题,如果不经过预处理直接进行分类,则容易造成维度灾难,极大的增加运算成本。鉴于此,本文利用数据挖掘技术给出两种数据流分类方法和一个完整的矿山微震数据流分类框架,提高微震数据分类识别的准确性、稳定性与实时性。本文主要工作如下:1.针对现有微震数据分类模型不具备适应概念漂移现象能力的问题,给出一种具有更新机制的集成分类方法。该方法使用支持向量机作为基分类器,保证集成分类模型的准确率,同时,在模型中增加更新机制,利用当前具有新概念的数据训练新基分类器,代替不再满足当前概念的旧基分类器,保证分类模型对概念漂移现象的适应能力。对比传统分类算法,实验结果表明该方法在微震数据流中具有更高的分类准确率和模型稳定性。2.为更好满足煤矿现场实时性要求,给出一种具有快速选择机制的微震数据流分类方法。改进集成模型现有的集成方式与更新机制,并使用随机森林算法作为基分类器,增加集成模型中各基分类器间的相异度。通过数据块聚类、基分类器训练、基分类器快速选择以及集成模型更新四个步骤,完成数据流的分类以及模型的自适应性更新。实验结果表明该方法可以提高时间效率,并具有较高的分类准确率以及模型稳定性。3.针对原始波形信号数据存在特征提取、波形变换、高维度降维的问题,给出一种预处理方法,并结合基于快速选择机制的分类方法,得到一个完整的微震数据流分类框架。首先,通过主成分分析将初始多通道数据降维至低通道;其次,利用小波变换将时域信号转化成频域信号;然后,利用线性判别分析将每个频段内的多维数据提取至低维;最后,对微震数据流进行分类识别。实验结果说明该框架具有良好的预处理效果,将高维度的时域信号转化为低维度的频域信号,压缩数据规模,减少后续分类模型的计算成本,具有较高的识别准确率。