粗糙集和蚁群优化方法在特征选择中的应用研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:jack607
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择已经成为数据挖掘、机器学习、模式识别等领域的研究热点。特征选择用更稳定的特征集合以适当的精度表示原始特征集合。特征选择的研究主要集中在两个方面,一是搜索特征子集时所需要的搜索策略,二是特征子集的性能评价方面。因此,研究更为有效的特征选择算法,有效地获取较优的特征子集,降低算法的时间复杂度和寻求快速的特征选择算法仍然是特征选择研究的重点。本文根据基于粗糙集的特征选择和基于蚁群优化方法的特征选择算法两种方法所具有的优势和存在的不足,提出一种将粗糙集方法和蚁群优化方法相结合的特征选择算法。其主要工作包括以下几个方面:首先,简要介绍了粗糙集理论和蚁群优化算法的相关知识,包括信息表达系统,上近似和下近似,属性约简与核,属性依赖度和重要度等概念和对蚁群算法的理论知识的总结概述。其次,对特征选择算法的进行了概要性分析。着重对基于粗糙集属性重要度的特征选择算法(贪婪法)和基于蚁群优化方法的特征选择算法进行了深入研究。再次,在分析基于粗糙集的特征选择方法和基于蚁群优化方法的特征选择算法所具有的优势和存在不足的基础上,本文提出了一种基于粗糙集蚁群优化方法的特征选择算法。所提出的算法通过引入粗糙集相对核属性作为特征选择的起点,以便提高算法的准确性;在转移规则和信息素更新策略中,引入了粗糙集属性依赖度和属性重要度,用于指导蚂蚁的搜索过程,以便提高算法的性能;此外,将粗糙集理论的分类精度和特征子集长度两个参数应用于评价函数中,以衡量特征子集的优劣;通过选择不同数据个数和属性个数的数据集对所提出的方法进行了测试,同时与基于粗糙集的特征选择方法和基于蚁群优化方法的特征选择算法进行了比较实验。测试与比较实验结果表明,所提出的方法可行的,并且对具有核属性的数据集在特征子集长度和精度两个指标上具有明显优势。最后,对论文的研究工作进行了总结,并提出了下一步的工作展望。
其他文献
随着Internet的快速发展,P2P技术的成熟使得现代的网络应用发生巨大的转变,目前它已成为发展最快的网络应用之一。P2P文件共享产生的流量可能是当前Internet最大的单项流量。
随着计算机科学技术的发展和计算机视觉理论的广泛应用,利用计算机图像处理技术对目标进行定位和实时跟踪的研究越来越热门。在智能化交通系统、智能监控系统、军事目标检测
随着Internet的快速发展,尤其是Web服务技术、电子商务等的广泛使用,XML作为一种自描述的半结构化数据模式已成为Web数据表示和交换的新标准,越来越多的信息处理系统采用XML
近年来,随着城市化进程的加快,城市公共交通问题也越来越严重。为了缓解城市交通压力,就需要大力发展智能交通,提高公共交通系统的运行效率和服务质量。而公交调度问题作为智
交通运输业是国民经济和社会发展的基础性产业,它的跨越式发展使得信息化成为必然选择。为此各级政府和相关部门建立了各种各样的交通信息管理系统,但由此也产生了一系列严重问
数据挖掘是从大量的数据中通过算法挖掘出未知潜在的知识或有价值的规律的过程。Apriori算法是数据挖掘关联规则中的经典算法,该算法通过对数据的关联性进行分析和挖掘,挖掘
移动自组网络(Mobile Ad Hoc Network, MANET)是一种具有高度动态拓扑结构,不依赖于任何固定基础设施支持的多跳、无线、自治网络,它具有灵活机动、组网快速、抗毁性强等优点
图像在生成、存储和传输的过程中,经常由于硬件设备、天气状况、光线强弱、噪声干扰等一系列的因素导致图像质量下降。为了复原这些退化图像,迄今已有一些成熟的图像复原的方
在电子政务中,电子公文交换占据着非常重要的地位,提高和改进电子公文处理的效率至关重要。由于没有一致的格式标准,不同单位产生的电子公文格式就可能不同,这必将导致共享程
本文以开源地学信息浏览器World Wind为主要研究对象,结合目前主流的地学信息浏览器、P2P技术深入分析了地学信息浏览器的系统架构和关键技术,并在此基础上对G/S这一新型的模