论文部分内容阅读
粗糙集理论作为一种处理模糊和不确定性知识的数学工具,在数据约简方面有着广泛的应用与研究,针对传统的粗糙集理论不支持对不完备决策表的约简这个问题,扩展的粗糙集理论相继被提出,在传统粗糙集的等价关系基础上发展出了相似、容差关系、限制容差关系等,当前基于粗糙集理论的约简算法,例如可辨识矩阵以及属性重要度等,都是基于数据的约简却忽略的数据之间的关系,同时在对大规模复杂数据集进行约简时,由于理论上得到最小约简是一个NP难度问题,使得约简的效率急剧下降,从而导致约简算法的不适用和不可操作性。在分析了现有粗糙集理论约简算法的基础上,本文针对当前粗糙集约简主要面临的一些问题,提出了一种聚类反馈约简算法模型。对传统约简算法中忽略数据关系而进行约简的问题提出了一种数据关系聚类算法,通过对关联点的提取来描述数据之间的关系,通过与云模型理论结合,将模糊粗糙性与随机性进行互补,利用云模型来进行数据集的划分,结合粒计算的思想将整个算法模型设计成一个可并行运行的算法,同时通过建立虚拟节点构建聚类粒度树,以邻近传播为策略,以反馈修正为导向,使得算法是一个满足增量式的约简的要求。在构建虚拟节点时,通过隶属度分类规则的调整,以提高整体的约简效率。并在数据点、关联点的提取时引入了数据集成映射的概念,以解决不同平台数据规格的不统一问题。本文基于数据关系的聚类反馈约简算法模型在总结前人研究的基础上借鉴了多种算法模型的特点,同时运用分层的思想,对约简过程进行了一定的改进。经过模拟实验,证明该算法模型是可行的、有效的。