论文部分内容阅读
上世纪80年代,Z.Pawlak提出了粗集这一不确定数据分析方法,进一步补充了概率论、证据理论、模糊集理论等不确定数据分析理论。经历近30年的发展,粗集模型已被广泛应用于许多领域。它的优点在于其能够评估数据之间的依赖关系,而无需任何的先验信息。目前,粗集理论已成为智能信息处理领域的重要数学工具之一。大量已发表的文献表明,数据约简与规则发现是粗集理论及应用研究中的重要内容。利用数据约简删除不相关或冗余数据有时会有助于数据分析效率的提高。近年来,随着粗集理论与应用研究的深入,结合粗集的多方法融合研究也逐渐引起了人们的重视。本文首先概述了粗集理论的背景以及粗集的理论基础。选择了数据分析中的连续属性的离散化、多属性决策中的权重确定以及支持向量机回归预测问题,在借鉴前人研究经验的基础上,将粗集理论方法结合运用于上述问题,主要完成以下工作:(1)分析了SOM神经网络聚类算法的流程。将自组织特征映射神经网络(SOM)与粗糙集理论中决策表不相容度的反馈信息结合,应用于信息系统或决策表中连续属性的离散化。给出一种基于动态SOM聚类的连续属性离散化方法。该算法不仅可以处理一致决策表还可以处理不一致决策表。数据实验表明:与其他已有的几种连续属性离散化方法相比,本文提出的方法具有一定的优点。(2)结合王国胤等提出的粗糙集模糊度的基础上,给出一种属性权重的定义。将其与TOPSIS方法融合,提出融合粗集属性约简和模糊度赋权的TOPSIS方法,并推广到多属性群决策方法中。算例说明了该方法的简便易行,有一定的应用价值。(3)将粗糙集理论与SVM融合,研究了结合粗糙集属性约简的支持向量回归机(RSSVR)在我国电力供应量回归分析和预测中的性能。实例研究表明:将粗糙集预处理作为SVR的前置模块,对原始数据有一定的精简作用,提取了部分主要属性,在一定程度上提高了SVR的预测精度。