论文部分内容阅读
知识约简是基于粗集理论进行数据挖掘的重要步骤获取最优知识约简是典型的Np-hard问题.在实际应用中,数据属性往往具有成本约束,并且数据本身含有噪声.本文提出了将粗集理论与遗传算法相结合来求解这种信息表的最优知识约简和近似知识约简的方法实验结果表明该方法具有很强的全局搜索能力,在有限的代数内找到信息表的最优约简:最小基约简集、最小成本约简集.当信息表含有噪声数据时,该方法能找出信息表的近似知识约简.