覆盖粗糙集的属性约简方法探讨

来源 :闽南师范大学 | 被引量 : 0次 | 上传用户:wzy_shun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Pawlak提出的粗糙集理论,是一个处理模糊和不精确性问题的数学工具,能对数据进行分析和处理,从中发现隐含的知识;并揭示潜在规律,做出准确决策。但是,Pawlak粗糙集是以等价关系为基础,在很大程度上限制了粗糙集理论的使用范围和处理效果。为了解决这种问题,近年来学者们提出了多种广义粗糙集模型,包含关系粗糙集、模糊粗糙集、变精度粗糙集和覆盖粗糙集等,其中覆盖粗糙集理论已是粗糙集理论的重要组成部分。
  在Pawlak提出的粗糙集理论中,属性约简是重要的研究内容之一,主要是去除高维数据的冗余信息,尤其在海量数据挖掘、特征选择、模式识别等多种领域有着至关重要的应用。在覆盖粗糙集理论方面,主要侧重于研究覆盖近似算子的性质,而基于覆盖粗糙集的属性约简的效率还可以进一步提高。那么如何提高覆盖粗糙集的属性约简算法的效率,降低算法的执行复杂度,是覆盖粗糙集的属性约简方面亟需解决的难题。因此,探索高效的覆盖粗糙集属性约简方法具有重要的研究意义。本文介绍基于图的覆盖决策信息系统的属性约简理论,给出一个基于图的属性约简的新算法。提出了局部覆盖粗糙集模型和多粒度局部覆盖粗糙集模型,并给出不协调覆盖决策信息系统的局部约简理论和多粒度覆盖决策信息系统的局部约简算法。具体的研究主要涉及到以下几个方面的工作:
  第一章主要阐述本论文所涉及的研究背景和现状,并且介绍主要的研究工作和论文的组织结构。
  第二章主要介绍基于图的覆盖粗糙集属性约简理论、图的极小顶点覆盖与覆盖决策信息系统属性约简之间的关系、覆盖决策信息系统的属性约简与求解一个超图的极小顶点覆盖的等价性。在这个基础上,提出一种新的基于图的覆盖决策信息系统属性约简的算法。实验结果表明,新的属性约简算法不仅可以有效地降低数据的维数,同时运行速度较快且能保持较高的分类精度,揭示该算法的高效性和有效性。
  第三章主要运用局部的思想,结合包含度的概念,提出局部覆盖粗糙集模型和覆盖决策信息系统的局部约简理论。给出了局部覆盖近似集的算法,并分析算法的优势。
  第四章主要介绍多粒度覆盖粗糙集,提出多粒度局部覆盖粗糙集模型和多粒度覆盖决策信息系统的局部属性约简算法。通过实例分析验证该算法的优势。
  
其他文献
学位
学位
学位
学位
学位
学位
随着大数据时代的来临,全球互联网产业展现出巨大的发展活力和韧性,在数字基建和数字经济迅猛发展的同时,我国网民规模、互联网普及率以及平均每周上网时长都有迅速增加扩大趋势,这导致网民们每天都充斥在海量的网络信息里,产生了严重的信息过载问题。如何解决当前信息过载问题已经非常迫切,需要对海量信息进行信息抽取和过滤,减轻负担。而对于信息抽取最重要的一环就是自动文摘,自动文摘就是利用计算机对文本中心内容进行简
大数据时代带来了信息量的指数增长,现实中各行各业积累了巨量的数据。由于数据采集难度和事件发生频率的不同,导致了各个类别的样本数量具有差异,形成了类别不平衡问题。类别不平衡问题造成了传统机器学习分类器的分类精度下降。已有的代价敏感学习方法能够较好地处理类别不平衡问题,然而复杂的类别中蕴含了类与类之间的层次结构关系。数据中类别具有层次关系的样本分布不平衡问题给机器学习分类任务带来了很大的挑战:(1)少
学位
在多标记学习中,由于丰富的标记结果需要由大量的特征属性描述,同时标记间自由组合的标记子集数量随着标记数量的增加而呈指数型增长,在样本有限的情况下导致只有少数标记子集具有样本描述且这些标记子集的平均覆盖样本数量较少,这表现为多标记学习中的两个特点:特征维度高和不均衡学习,因此多数传统的单标记特征选择算法无法很好的直接应用到多标记学习任务中。本文以经典的FisherScore单标记特征选择算法为研究对
学位
在大数据时代,特征选择作为一种数据预处理技术,在机器学习领域发挥着越来越重要的作用。目前,大多数特征选择方法主要应用于单标签数据,然而,随着数据维度和标签的不断增加,特征选择已经广泛的应用于多标签数据,并产生了较好的分类效果。传统的一些多标签特征选择算法大多度量特征与整体标签集合的相关性,并选取一组相关性较大的特征子集,然而,多标签数据中的标签间存在着复杂的结构关系,如果仅仅去度量特征与标签间的相
学位