论文部分内容阅读
属性约简是Rough集研究的重要内容之一。所谓属性约简是指在保证信息系统分类或决策能力不变的条件下,删除条件属性中的冗余属性,从而减少数据挖掘要处理的数据量,提高数据挖掘结果的简洁性。国内外学者在这方面做了大量的研究,提出了多种属性约简算法。如基于正区域的属性约简算法,基于Skowron提出的区分矩阵的约简算法和基于信息熵的属性约简算法。然而属性约简的求解是一个NP困难问题,导致该问题的主要原因是属性的组合爆炸。目前还不存在一种非常有效的方法,因此寻求快速的约简算法及其增量版这一问题仍是粗糙集理论的研究热点之一。本文根据当属性集合A的条件信息熵等于属性集合AU{a}的条件信息熵时,属性a不能为属性集A添加任何分类信息,可以将a删除为基础。对CEBARKCC算法进行改进,从而减少了不必要的计算,节省了时间。