基于粗集的数据挖掘算法研究及应用

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:ribenandchina
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据量的飞速增长,数据挖掘成为从大量数据中发现知识的重要手段。粗集是一种处理模糊和不确定性数据的工具,因而成为数据挖掘中的重要框架。约简和核是粗集理论的核心内容,数据经过约简后更有价值,更能准确的获取知识。本文针对粗集展开如下工作: 首先,本文在国内外有关数据挖掘(DM)与知识发现(KDD)方面的学术研究成果的基础上,研究了数据离散化处理和数据泛化的方法;讨论了属性约简的基本算法;研究了属性约简的典型算法,包括基于逻辑运算的属性约简算法、基于频度的属性约简算法、基于属性依赖度的属性约简算法、基于信息熵的属性约简算法,并分析了各约简算法的时间复杂度;提出了后删除属性的约简算法,该算法无需求核运算,节省了时间和空间,简化了求解过程。 其次,本文在约简的基础上研究了最简规则提取算法、典型规则提取算法;研究了决策树建立的算法,在讨论了ID3算法的基础上提出了基于粗集的决策树建立,并以实例验证其正确性。 最后,本文在上述理论方法研究的基础上,设计了基于Rough Set的知识发现工具。
其他文献
无线ad hoc网络具有许多不同于有线网络的特性,而由这些特性带来的大量的问题至今为止并没有得到完全解决,从而导致TCP业务在无线ad hoc网络中的性能不如在有线网络中那么令
蓝牙技术是一种短距离无线数据与语音通信的开放性标准。蓝牙技术具有低成本、低功耗、容易组网等优点,在许多领域逐渐得到广泛应用。 作为无线自组织网络,蓝牙网络既具有
随着近年通讯技术的迅速发展,出于对移动通讯需求的快速增长,无线网络技术渐受瞩目;无线网络技术将激起另一波巨大的产业变革。而蓝牙技术,被认为是实现个人与互联网最后10米
异构信息网络分析是近年来数据挖掘领域中非常热门而新颖的研究方向,受到越来越多专家学者的关注。现实世界中来自各种不同领域的系统中往往都存在多种类型的对象,不同类型的对
作为金融设备中的关键设备之一,货币识别接收器已广泛应用于各种交易场合。但随着自助服务行业的发展,货币识别接收器在应用中已面临着新的问题:一方面,由于货币版本的不断更
UML(统一建模语言)是一种通用的可视化建模语言,用于对软件进行描述、可视化处理、构造和建立软件系统的文档。在当前软件项目开发过程中,UML建模被广泛使用,很好地提高了软
现今手机、平板电脑等手持移动设备的运算能力日益增强,搭载智能系统的移动设备逐渐融入人们生活,成为日常活动不可或缺的一部分。手持移动设备大多存储了大量涉及用户隐私的
  本文指出了ASP.NET对MVC模式不足之处,并且在ASP.NET的基础上做出扩展,设计并实现了Z-MVC扩展。它重新定义了模型、视图、控制器、数据库四者之间的通信,能有效地解决模型、
本课题以我公司承担的大型空中交通管制系统研制项目为背景、为满足研制任务的需要而提出。自动化空中交通管制系统是一种专用、实时、使命重大型系统,对系统各方面的质量指
本文着重研究了基于IPv6的网络视频应用的技术架构以及在IPv6下的网络视频应用的开发技术,对基于IPv6的网络视频应用——组播视频进行了深入的分析和探讨,并给出了应用的实例