论文部分内容阅读
数据挖掘是一种对数据分析、理解,并研究数据内部蕴含知识的技术,是当前人工智能研究中特别活跃的领域。粗糙集是一种新的数据挖掘技术,该理论不需要任何先验的知识,就可以分析和处理不精确、不完整的信息,并从中发现隐含的知识,揭示潜在的规律,近年来基于粗糙集的数据挖掘越来越被人们重视。本文首先对近年来基于粗糙集理论的数据挖掘的历史、过程及方法进行了综述。介绍了粗糙集理论的基础知识。其次,介绍了粗糙集的核心部分即属性约简及决策规则获取的算法。讨论了两种基于差别矩阵的属性约简算法,并对这两种算法进行了举例说明。并针对差别矩阵在解决较大的决策表的属性约简问题时出现的时空复杂度偏高的问题,提出了运用逻辑差别矩阵来进行属性的约简,这就大大提高了运算的效率,同时针对不一致的决策表,对逻辑差别矩阵概念进行了修正,提出了本文的改进算法,该算法直接利用改进的逻辑差别矩阵进行矩阵的生成,避免了决策表不一致时传统算法带来的错误结果,又对几个属性在逻辑差别矩阵中出现的次数相同的情况进行了补充,并在算法得到约简后,加上了一个反向相消的过程,这些都使得该约简算法能更加有效的得出最小的约简集合。再次,简单的介绍了规则获取算法,并在其基础上增加了删除重复记录的步骤,有效提高了约简效率。最后,针对当代大学生学习风气状况,运用本文提出的属性约简算法和规则提取算法,研究了影响大学生学习风气的几种因素与大学生综合绩点的关系,并确定了影响综合绩点的关键因素,提出了提高大学生综合绩点的规则。