粗糙集和计算智能相结合的数据挖掘算法研究

来源 :长沙理工大学 | 被引量 : 3次 | 上传用户:yzz133
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
海量数据与知识贫乏导致了数据挖掘技术的出现,它的主要目标是采用自动的、智能化的新技术来分析海量数据,以获得有效的、隐含的、以前未知的、有潜在使用价值的有用信息。它是当今众多学科领域特别是数据库领域最前沿的研究课题之一。粗糙集理论是一种新的处理模糊和不确定性知识的数学工具,其主要思想是在保持分类能力不变的情况下,通过知识约简,导出问题的决策或者分类规则。计算智能技术以神经网络、模糊逻辑以及进化计算等为核心,模仿人类的思维方式及演化规律,已经在工业控制、模式识别等领域得到了广泛的应用。目前,在数据挖掘领域粗糙集和计算智能方法相结合还主要用于数据预处理阶段,基于他们的分类、聚类和关联规则挖掘算法还很少。本文介绍了数据挖掘、粗糙集理论和计算智能理论的基本概念以及应用,分析了粗糙集理论和计算智能理论在数据挖掘方面的应用以及它们之间的互补性。针对粗糙集在处理符号属性方面的优势,设计了一种新的聚类算法,将基于共享机制的小生境遗传算法运用到分裂式层次聚类算法中,并用粗糙集的思想来定义遗传算法的适应度函数,实验表明该算法在面向符号属性进行聚类时具有较高的聚类准确率。此外,提出了一种新型分类算法,将粗糙集与组织协同进化分类算法相结合,利用支持子集的思想来决定组织的适应度,利用支持子集得到的启发信息来加快进化速度,增强种群之间的相互协同,实验表明,当数据集中的属性全部为符号属性时,该算法具有较高的分类准确率并且时间代价较小。
其他文献
随着计算机网络和电子商务的普及,网络安全问题越来越受到重视,而电子商务协议就是解决电子商务中网络安全问题的有效手段之一。虽然电子商务协议使用密码系统来确保其安全性,但
本文提出的任务调度算法是针对实时数据平台中传统任务调度存在的负载不均衡及任务实时性差等问题给出的解决方案。在查阅了大量的国内外文献的基础上,对实时调度及负载均衡
人的一生中大约有1/3的时间是在睡眠中度过,睡眠质量的好坏与人类的身心健康和工作生活有着极为密切的关系。睡眠过程会经历几个相对稳定的睡眠状态,医学上称之为睡眠分期,而
随着Internet的迅速发展,网络信息增长的速度与人们获取所需信息能力之间的矛盾越来越突出。搜索引擎这一新兴技术也越来越体现出其自身的重要价值。作为搜索引擎的数据后勤
电信资源管理系统是网络和业务管理的基础,端到端的网络和业务管理,需要综合的资源管理,综合资源管理是把独立建设的各专业网的资源管理系统综合起来,统一对电信网中的各种网
即时通信是一种源于互联网的准实时的通讯方式,包括即时消息和呈现两种典型的业务。其中,呈现业务是一种传递用户的可达性、可用性、通信能力和通信意愿等状态信息的业务。随
三维服装变形模拟和动力仿真可以对服装的合体程度、款式和压力等各个方面进行虚拟审视与检测,所以有着广泛的应用前景,其应用范围涉及虚拟服装店、虚拟现实、人物动画、电子游
由于MPLS网络在设计当初并没有很好地考虑自身的安全性,因此其相关的安全问题便逐渐暴露出来。针对MPLS网络系统在设计和实现时的脆弱性,从协议改进方面进行着手,设计安全的MPLS
随着计算机技术及Internet的发展,网络规模的扩大,建立完善的网络管理系统显得非常重要。故障管理是网络管理的核心,故障诊断又是其中的难点与重点,其有效与否和功能强弱直接关系
空间移动对象的轨迹和查询是移动对象数据库中的关键技术,成为当前数据库领域研究的热点问题。本文重点研究了非约束环境和网络环境中移动对象轨迹的查询问题。 本文研究了