论文部分内容阅读
粗糙集(rough set)理论是由波兰科学家Z Pawlak在1982年提出的一种新型的处理模糊和不确定知识的数学工具。这一理论从新的视角出发对知识进行了定义,它把知识看作是关于论域的划分,并引入代数学中的等价关系来讨论知识。 目前已经在人工智能、知识与数据发现、模式识别与分类、故障检测等方面得到了较为成功的应用。粗糙集理论具有一些独特的观点,这使得粗糙集特别适合进行数据分析。 本篇论文首先对粗糙集在数据挖掘中和多种方法相融合的介绍。然后描述了粗糙集的基本算法;包括等价关系,上下近似及属性约简与属性值约简等多种算法。最后利用了贪心算法与属性值约简相结合,用贪心的奇偶位法来进一步优化了属性值约简。