基于进化算法的属性约简方法研究

来源 :长沙理工大学 | 被引量 : 1次 | 上传用户:yongheng0106
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是指从含有大量数据的数据库中提取有效的、有潜在价值的、新颖的信息和知识的非平凡过程。在许多的数据挖掘方法中,粗糙集方法是其中的一种很好的数据挖掘工具。在上个世纪八十年代粗糙集理论是由著名的波兰数学家Z.Pawlak提出的处理模糊和不确定性问题的一种数学方法,它可以分析出隐含在数据中的事实,并且基本上不需要提供任何相关数据附加信息,粗糙集理论已经在社会许多领域中获得了比较成功的应用,比如模式识别、知识发现、机器学习、决策分析等领域。信息系统的属性约简是粗糙集理论的重要内容之一。但寻找信息系统的最优约简或全部约简是一个NP问题。遗传算法是一种模拟生物进化过程的最优解的方法,具有全局搜索、鲁棒性强、可扩展性、隐含并行性等特点,已经被广泛应用到粗糙集属性约简中。为了能够快速有效地获取信息系统中属性的最小约简,在分析遗传算法与属性约简的方法的基础上,将属性重要性度量作为启发式信息引入遗传算法,构造出了一种基于启发式变异算子的属性约简算法。该算法通过构造新的变异算子来引入启发式信息,这样体现了启发式信息的局部搜索技术,并使得该算法不仅保持整体优化特性,而且还具有较快的收敛速度。差分进化算法是基于一种变异、交叉、选择的全局进化优化算法,将差分进化算法应用到多个个体组成的群体,这样得到的群体中的个体可以一代接一代地得到优化,并逐步逼近算法的最优解。该文将差分进化算法引入粗糙集属性约简中,构造出基于差分进化算法的粗糙集属性约简算法。实验结果表明,这两种方法都能快速有效地求出决策表的最小约简。
其他文献
现今的并行编程实践多采用锁等较低的同步机制访问共享资源,这种编程困难且易出错;新引入的原子区构造虽简化了编程,但支持其实现的软硬件技术尚不令人满意。我们课题组就同
随着计算机网络和多媒体技术的飞速发展,信息安全成为全社会的需求,其中信息隐藏技术作为信息安全的重要方面,近年来得到了很大的关注。而由于JPEG图像的广泛应用和它提够的
学位
从国家实行金税工程以来,国家税务管理不断加强,也形成了多项国家标准和规范。从2007年开始,我校税控系统项目组为国家税务局开发针对大型商场的税控系统,并编写了国标七规范
学位
随着传感网、物联网、泛在网和智慧地球等概念的提出,无线传感器网络做为计算机科学与技术中一个重要的研究领域,对他们的研究和发展具有一定的支撑性作用。无线传感器网络的
Web信息具有动态性、分布性和规模性的特点,未来的Web服务应该向人们提供智能化、个性化的服务,并且能够有效地解决现实问题。在当今Web背景下,单一推理技术已无法满足现实问题
学位
秘密共享是现代密码学的一个重要分支,是保障信息安全和数据保密的重要手段之一。利用秘密共享保存和管理秘密信息,一方面可以防止权力过于集中而被滥用,分散了责任;另一方面
车间流水作业调度问题是生产、调度领域的一个热点、难点,是许多实际生产调度问题的典型调度简化模型。总完工时间是一个重要的衡量指标,它的最小化能有效提高设备利用率、缩短
H.264是国际电信联盟与国际标准化组织联合推出的新一代视频编码标准。该标准采用了先进的编码技术,具有卓越的压缩性能,并且易于网络传输,能够满足多种视频应用的需求。因此
学位
随着计算机与网络技术的快速发展,大数据集的出现致使人们获取的信息量正在以前所未有的速度日益剧增,也导致大量不相关或冗余数据的不断涌现。因此,如何快速获取所需有用信
当今,各种各样的企业级应用系统的使用缩短了业务流程执行的周期,提高了业务处理的效率,降低了业务处理的成本,并且能够为企业未来发展决策提供强有力的数据统计和分析的支持。但