论文部分内容阅读
模式识别、自然语言处理和生物信息学等各领域的高维数据,存在着大量的无关和冗余特征,增加了数据分析时问题的复杂度,因此有必要通过特征选择来剔除无关和冗余特征。基于互信息的特征选择算法评价准则存在以下不足:评价标准单一,以最小化特征之间冗余性或最大化特征提供的新分类信息评价特征,选择出的特征不具有最佳的类辨别能力;基于累加求和的评价准则易过高估计特征的重要性。为此,提出一种基于最大相关性独立分类信息最大化(maximum relevance and independent classification inf