基于粗糙集的属性约简和核的快速更新算法研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:HJ565dgdgd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是由波兰科学家Z.Pawlak在1982年提出的一种处理模糊、不精确知识和不完备信息的数学工具。该理论的特点是不需要任何先验的知识,或者任何附加的信息,就能有效地分析和处理这类数据,从中发现隐含的知识,揭示潜在的规律性,即决策规则。近年来,粗糙集理论在人工智能和认知科学领域具有重要的地位,特别是在知识发现、机器学习、决策分析、过程控制、模式识别、数据挖掘和专家系统等领域得到了广泛应用。在粗糙集理论中,属性约简和求核是重要的研究内容之一。属性约简,就是在保持知识库(决策表)中分类能力不变的情况下,删除知识库中无关或不重要的属性,使得知识库中的知识表示得到简化,而又不丢失其基本信息,如果能将冗余属性删除,则可以减小知识库规模,节约成本,并能提高知识库中潜在知识的清晰度。由于对知识库进行属性约简,很多算法都是以核为基础,然后在核的基础上逐步得到属性约简,因此,研究快速的属性约简和求核算法具有重要的理论意义和应用价值。目前,现有的大多数算法均是以静态决策表为基础而设计的,而针对动态决策表的算法的研究较少,但实际决策表中的对象通常是动态变化的,故原来的核和属性约简可能已经不再是新决策表的核和属性约简,为此需要对新决策表进行重新计算。在以静态决策表为基础的属性约简和求核算法中,对于更新后而变化不大的新决策表而言,将会使得原来算法中大量有用的信息没有得到有效的利用,特别是对一些实时性要求较高的场合,这种以静态决策表为基础的属性约简和求核算法往往不大适用,因此,研究高效的动态更新算法具有广泛的实际意义。本文首先简单介绍了粗糙集理论的研究动态和基础理论知识,然后系统地概述了现有的基于决策表的常见属性约简和求核的模型及相关算法,其中包括基于正区域的算法、基于差别矩阵的算法、基于信息熵的算法。本文在学习和借鉴已有研究成果的基础上,主要的创新点如下:1)利用位图和粒计算技术提出了一种改进的基于正区域的属性约简(Pawlak Reduction)新算法。在该属性约简算法中,设计了一种能减少粒计算数目的启发式信息,有效地减少了不影响属性约简结果的大量计算,并通过实例仿真和实验结果表明了新算法的有效性和正确性。2)给出一个简化二进制差别矩阵的属性约简定义,从理论上分析证明了该属性约简的定义与基于信息熵的属性约简的定义是等价的。为求出简化的二进制差别矩阵,采用了一个快速求简化决策表的算法。在此基础上,设计了基于信息熵的简化二进制差别矩阵属性约简算法,并分析了算法的时间复杂度和空间复杂度分别为max{O (| C || U |), O (| C |2 | U′|2 )}和max{O (| C || U′| 2), O (| U|)},并通过实例仿真显示新算法的效率优于典型的算法。3)分析了现有的常见求核增量式算法的不足,为了有效地提高动态决策表的核增量式更新效率,本文首先引入简化决策表,然后结合简化的二进制差别矩阵设计了一种新的基于决策表的核增量式高效更新算法。该算法在更新简化的二进制差别矩阵时,只需在原决策表基础上对记录进行相应的更新,不需要重复计算原决策表的二进制差别矩阵。采用边更新简化二进制差别矩阵边计算核,显著地提高了动态更新核的效率和灵活性。算法的时间复杂度和空间复杂度分别为O( | C || U′|)和O (| C || U′p os|| U′|),并通过实例仿真和实验性能对比表明了新算法的有效性。4)由于对决策表进行属性约简,很多算法都是以核为基础,然后逐步得到属性约简。本文在3)增量式更新核的基础上,利用位图技术,并结合简化的二进制差别矩阵设计了一种新的基于决策表的属性约简增量式快速更新算法,算法的时间复杂度和空间复杂度分别为max{O ( | Red || U′p os || U′|), O( | Red ?Core|2 | U′p os|| U′|)}和O (| C || U′p os|| U′|),并用实例仿真说明了新算法的有效性。
其他文献
随着信息技术的发展,人们对信息的安全性的要求越来越高,传统的身份识别方法已经不能满足社会发展的需求。在这种情况下,掌纹识别技术就随之诞生了。本文对掌纹图像的定位和
随着信息技术的飞速发展,互联网的信息量以指数方式增长,Web已经成为了信息的海量数据库。互联网为用户提供了良好的信息源,但是,如何快速、准确的从这个信息库中获取需要的
随着蛋白质测序技术的发展,蛋白质序列数据量不断增加,使得采用数据驱动的方法通过蛋白质序列预测蛋白质结构和功能成为可能。频率谱中包含大量的进化信息,它能够从进化的角度更
智能视频监控技术是当今前沿的研究课题。它利用图像处理和计算机视觉所涉及到的方法,在实时监控画面中对场景中的运动目标进行检测,跟踪和识别,并在一定程度上分析运动目标
软件复用是在软件开发中避免重复劳动的有效解决方案,软件构件技术是软件复用的主要手段,随着嵌入式手持设备的广泛应用,嵌入式领域的构件技术也成为国内外研究的热点之一。L
与时俱进的网络通信和日趋频繁的互联网应用虽然降低了人类生活的沟通成本,但也提高了对信息传递的安全性要求。由于图像数据的强关联性,传统的文本加密方案并不具有普适性。
飞行器试验中,遥测环境参数直接反应内弹道工作状态,遥测环境参数处理结果是鉴定飞行器试验成功与否的重要依据。目前,飞行器试验遥测环境参数的处理仍然依赖于基于傅里叶变
随着多媒体技术及Internet的迅速发展,人们越来越多地接触到各种各样的图像信息。如何组织、管理和利用以图像为主的多媒体信息具有重要的意义。但是到目前为止,基于内容的图
在操作系统安全方面,访问控制的地位是极为重要的,其作用是显示地控制主体对客体的访问权限,从而防止客体被非法访问、篡改等非法操作。本文将对目前的访问控制研究进行总结,
磁共振成像(MRI)是利用人体内含有的大量氢离子在磁场内发生共振所产生的信号经检测和处理最终重建出图像的一种成像技术。MRI成像因其无创伤、无痛苦、很少受目标物体运动影响