论文部分内容阅读
针对传统特征选择判据计算量大、需要先验知识以及应用效果不佳的缺点,根据分类错误通常发生在类别之间的邻接区域(贝叶斯决策分界面将穿过该邻接区域)的特点,提出基于邻接区域交叠概率的特征选择判据。该判据通过计算案例样本点落在类别邻接区域中的概率来选择特征,具有从样本中能直接计算并且选择出多个特征组合等优点。通过对标准机器学习数据集WINE的实际应用表明,该判据选择出的特征组合的聚类效果明显好于类内类间判据选择出的特征组合。对轴承故障数据进行特征选择时,该判据能提供多种多个特征组合供选择,其选择的垂直和水平