论文部分内容阅读
针对传统分类算法对工业传感器的高维不平衡数据分类效果不理想问题,本文提出一种基于多重筛选的随机森林不平衡特征选择算法.首先提出基于特定因子的不平衡数据处理方法,得到平衡数据集,其次对特征进行基于相关系数图的特征筛选,最后引入最大互信息系数(MIC)计算特征与类别之间的相关性,完成最后一次筛选.采用工业冲压机温度传感器、压力传感器、三相电传感器等传感器数据集完成冲压机故障预测实验,结果表明此优化算法能有效解决高维不平衡数据分类效果不理想的问题,准确率、精确率、召回率以及G-mean系数均比单一模型更高.