论文部分内容阅读
数据挖掘技术是当今智能系统理论的重要研究内容,它综合运用人工智能、计算智能(人工神经网、遗传算法)、模式识别、数理统计等先进技术从大量数据中挖掘和发现有价值和隐含的知识。粗糙集理论是20世纪80年代初由波兰数学家Z.Pawlak首先提出的一种处理含糊和不确定信息的新型数学工具,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出概念的分类规则。近年来,粗糙集已成为人工智能和信息科学最活跃的研究领域之一,并且在数据挖掘、模式识别、机器学习、知识发现、决策分析等领域得到成功的应用。本文首先介绍了传统粗糙集的基本理论及其应用。传统粗糙集是建立在不可分辨关系(等价关系)基础之上的,用一对上、下近似集合来表示一个不精确的概念。其次,介绍了扩展粗糙集模型-基于多级优势关系的粗糙集模型,它能解决传统粗糙集方法不能解决的有偏好序的多属性决策问题。不完备信息下的数据挖掘是一个难题,但它在实际决策中是不可避免的。利用基于优势关系的扩展粗糙集模型,结合有关模糊集理论知识,给出了一种区间值属性决策表的数据挖掘方法,该方法能有效的挖掘出决策系统的决策规则。提出了区间值多属性决策问题的一种排序方法。使用一个两两比较表代替原来的决策表,通过优势粗糙集理论推理出决策系统的决策规则,进而对决策方案进行排序,获得最佳方案。