论文部分内容阅读
特征选择是一种重要的数据预处理步骤,其中互信息是一类重要的信息度量方法.本文针对互信息不能很好地处理数值型的特征,介绍了邻域信息熵与邻域互信息.其次,设计了基于邻域互信息的最大相关性最小冗余度的特征排序算法.最后,用此算法选择前若干特征进行分类并与其它算法比较分类精度.实验结果表明本文提出算法在分类精度方面且优于或相当于其它流行特征选择算法.