论文部分内容阅读
粗糙集理论自提出以来,其理论与方法不断得到发展,在许多方面克服了传统数据分析理论显现出的诸多不足,表现出其独特的优势,受到了国内外学术界的广泛关注。本文面向海量数据从多个层面对粗糙集理论进行了学术探讨,评述了国内外研究进展,深入研究了基于粗糙集的约简,可变精度粗糙集模型,动态约简,规则集决策分析,多知识库决策融合等方面的问题。 (1) 基于归并的约简分析,描述了归并为属性约简的最本质特征,给出了约简的细分层次关系,体现为偏序格结构,从实质上把握了一个决策信息系统的约简特征。根据分类特性,探讨了信息熵、决策熵和条件熵的思想,给出了它们的性质,以及相互之间的关系,分析了他们对决策信息系统不确定性和约简的影响。对时序决策信息系统,重点研究了时序信息系统的获取及约简等基本问题,提出了时间重要性约简策略。 (2) 深入分析了可变精度粗糙集模型的约简异常,通过引入条件类包含度阀值的概念,描述了包含度与分类率的区间关系,分析了包含度区间的动态变化和正区域变化引起的约简异常,提出了消除异常的区间约简基本思想,并构造了区间约简算法,完善了可变精度粗糙集模型约简。 (3) 阐述了动态约简基本思想,进一步描述了多层次的形式化动态约简模型,提出了F族计算的新方法,把约简精度系数引入到对抽样的估计中,并进行了深入细致的特性分析,获得了良好的结果。提出了动态核概念,研究了动态核的多层次形式化定义,探讨了动态核具有的基本性质,论证了动态约简交集对动态核的包含性,该思想对各层面的动态约简形式化定义都具有一致的适应性,从而说明动态核真正具备了属性核的本质特征。 (4) 研究了决策规则的多种度量,分析了度量体现的性质,提出了规则集合的决策度量,从整体上体现了一个规则集合的性能,为多知识库模型选择奠定了基础。针对目前值约简方法的不足,提出了基于规则分辨矩阵的值约简思想,从整体上体现了一个规则集的性质,完整地阐述了值约简,为决策分析奠定了基础。 (5) 基于模型集成的基本理论,给出了模型的形式化表示,提出了模型组合关系与模型集成方法,把规则知识库作为一个单元决策模