基于粗糙集的数据挖掘应用研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:caiguoxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一种对数据分析、理解,并研究数据内部蕴含知识的技术,是当前人工智能研究中特别活跃的领域。粗糙集是一种新的数据挖掘技术,该理论不需要任何先验的知识,就可以分析和处理不精确、不完整的信息,并从中发现隐含的知识,揭示潜在的规律,近年来基于粗糙集的数据挖掘越来越被人们重视。本文首先对近年来基于粗糙集理论的数据挖掘的历史、过程及方法进行了综述。介绍了粗糙集理论的基础知识。其次,介绍了粗糙集的核心部分即属性约简及决策规则获取的算法。讨论了两种基于差别矩阵的属性约简算法,并对这两种算法进行了举例说明。并针对差别矩阵在解决较大的决策表的属性约简问题时出现的时空复杂度偏高的问题,提出了运用逻辑差别矩阵来进行属性的约简,这就大大提高了运算的效率,同时针对不一致的决策表,对逻辑差别矩阵概念进行了修正,提出了本文的改进算法,该算法直接利用改进的逻辑差别矩阵进行矩阵的生成,避免了决策表不一致时传统算法带来的错误结果,又对几个属性在逻辑差别矩阵中出现的次数相同的情况进行了补充,并在算法得到约简后,加上了一个反向相消的过程,这些都使得该约简算法能更加有效的得出最小的约简集合。再次,简单的介绍了规则获取算法,并在其基础上增加了删除重复记录的步骤,有效提高了约简效率。最后,针对当代大学生学习风气状况,运用本文提出的属性约简算法和规则提取算法,研究了影响大学生学习风气的几种因素与大学生综合绩点的关系,并确定了影响综合绩点的关键因素,提出了提高大学生综合绩点的规则。
其他文献
图的控制理论是图论中比较活跃的研究课题之一。本文主要研究了以下五种类型的符号边控制数:  第一、我们主要在符号边控制数的基本概念与性质的基础上,通过特殊构造法研究
对于简单图G,f是图G的一个E-全染色(即:相邻顶点染不同颜色,关联元素染不同颜色);若相邻两点的色集合不同,则称该染色法f为邻点可区别E-全染色;进一步,若相邻两点的色集合互不包含,
  分形插值函数是由一类特殊的迭代函数系生成的一种分形函数, 它对于那些自然界中普遍存在的处处连续而又处处不光滑的曲线和曲面的拟合与逼近显示了独特的优越性. 本文首
近年来,种群动力学已成为动力系统中的重要研究课题之一.种群动力学作为生物数学的重要分支已经得到了广泛的研究和长足的发展.本文主要考虑具有阶段结构的捕食-食饵交错扩散
粗糙集理论是解决含有不完备性信息问题的重要理论知识,粗糙集模型的推广程度对于处理不确定性信息问题起到关键作用。为此,本文从下面三个角度对模型进行研究:1.有关覆盖的
变分不等式理论是研究非线性边值问题的重要手段之一,经过几十年的发展,其在接触力学、最优控制、流体力学、工程管理以及经济均衡等学科中得到广泛的应用。得益于实际的问题模
随着三维扫描技术的提高,三维数据处理和形状分析技术引起了广泛重视,图形匹配也成为了研究的热点。图形匹配在网格变形,纹理映射和统计形状建模等方面都有着应用。图形匹配是指寻找两个图形之间点到点的对应关系,主要包括刚性匹配和非刚性匹配。刚性匹配研究已相当成熟,而非刚性匹配是研究的难点,即使是近似等距匹配仍会产生一些问题,对内蕴对称图形进行匹配时容易出现对称混淆。本文主要研究内容就是解决图形匹配的对称混淆
学位
未来十年,人工智能系统可以从一个良性循环中受益:我们需要依靠知识,才能很好地理解语言,反过来,我们需要的知识也蕴藏在语言中,分散在世界各地的书本和网页上。如果计算机能