论文部分内容阅读
近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量可供使用的数据,并且迫切需要将这些数据转换成有用的信息和知识。 进行数据挖掘的方法很多,粗集方法便是其中的主要方法之一,将粗糙集应用于数据挖掘领域,能提高对大型数据库中的不完整数据进行分析和学习的能力,具有广泛的应用前景和实用价值。 属性约简又是粗糙集理论中的一个重要课题,如果能将冗余属性删除,将会大大提高系统潜在知识的清晰度,降低发现规则的时间复杂性,提高发现效率。 本文主要研究基于粗集理论属性约简的数据挖掘技术。首先,对数据挖掘和粗集理论进行研究,并在分析和综合原有基于粗集理论的数据挖掘算法的基础上,提出了改进的启发式属性约简方法,即基于加权平均和频度的双向选择约简算法。其次,介绍了数据挖掘系统,一是产生规则,利用属性约简算法约简属性,从而得出规则;二是规则分类,利用已产生的规则分类新对象。最后,通过实例验证了本文提供的方法是可行的和有效的。