论文部分内容阅读
粗糙集理论是一种能够很好处理不确定信息的数学工具。近年来,粗糙集理论在数据挖掘领域得到了越来越多的应用。聚类与属性约简一直是数据挖掘技术中的重点与难点,如何进一步地提高粗糙集理论在这方面的利用率具有十分明确的意义。本文的研究工作如下:1.在给出了聚类的基本定义和方法之后指出了经典k-means算法的不足,利用粗糙集理论优秀的边界数据处理能力和粒子群算法全局搜索能力强的特点,提出了一种基于改进粒子群算法的粗糙聚类方法。实验表明,该方法对聚类过程中的边界处理能力更强,与同类方法相比,其准确性和稳定性都更高。2.首先介绍了两大类常用的属性约简方法并简要分析了各自代表算法的特点,然后指出了当前大多数基于属性核的约简方法不能处理不完备信息系统的不足,进而利用限制容差关系构造了一种改进的区分矩阵,在此基础之上提出了一种基于限制容差关系的属性约简方法,最后通过实例对比指出该算法与同类方法相比能够保证所求约简为相对最小约简。