论文部分内容阅读
1982年粗糙集理论作为一种新的处理不确定和模糊问题的理论被波兰科学家 Z Pawlak提出。此后,粗糙集理论成了继证据论、模糊集论、概率论之后提出的又一个新的数学工具。粗糙集理论在处理信息的时候,最大的优点是不需要该被处理信息之外的任何先知知识,就能够对不精确、不完整或者不一致的信息按照用户的需要进行行之有效的分析,并从处理的信息中发现隐含的内在联系,揭示知识的潜在规律。 属性约简的研究是粗糙集理论在实际应用中使用最普遍也是最重要的内容,它应用的基本思想主要是在保持分类能力不改变的前提下,通过删除冗余属性集(值)的方法,寻求对信息系统有决定性影响的重要属性,以提高知识的质量,方便用户决策。属性约简算法有很多,文中主要介绍基于分类的属性重要性约简方法。本文从基本的粗糙集理论知识入手,首先概述了粗糙集理论的相关知识,详细地分析了经典粗糙集理论的属性重要性约简算法,并介绍了基于数据分析的属性约简算法思想,通过比较分析,指出目前较流行的几种基于粗糙集的约简算法由于受其本身适用范围的限制,都存在一些这样或那样的不足。 在前述知识和方法的基础之上,本文给出了一些应用实例:(1)将属性约简应用于影响普通高校专科入读率分析中,利用分类属性约简的方法,对由新生的特征信息形成的信息系统进行约简和决策规则提取,获得影响新生入读率的关键因素。(2)将属性约简应用于教学质量评估系统中,对评估数据实例本身所提供的信息,通过等价关系和等价类的确定和属性约简,从大量信息中快速有效地发现特定知识。(3)研究了均匀分布问题,分析了“新生生源地分布情况”与上近似的关系,形成了属性约简的均匀分布方法。 粗糙集理论中的属性约简方法还处在继续发展阶段,尚有一些理论上的问题需要进一步的研究和探讨,文中最后总结了本文的主要内容,提出今后有待进一步研究和完善的工作。