基于粗糙集与优化算法的特征选择研究

来源 :青岛科技大学 | 被引量 : 0次 | 上传用户:wori10000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术在各行各业的广泛应用,不同领域的数据呈现爆炸式增长。数据挖掘技术能够从海量数据中挖掘出新颖、有规律并且对决策有用的信息。特征选择是数据挖掘中非常重要的研究方向。作为一种应对“维度灾难”的有效方法,特征选择不仅能够降低数据挖掘算法的计算开销,而且还可以提高数据挖掘模型的性能。特征选择本质上是一个组合优化问题,因此,利用各类智能优化算法来解决特征选择问题已成为当前的研究热点。近年来,基于粒子群算法的特征选择方法和基于人工鱼群算法的特征选择方法引起了广泛关注。这些特征选择方法利用粒子或人工鱼寻优的随机性,能够在一个指定的范围中快速定位到最适合评价函数的解,可以在一定程度上解决特征选择效率不高的缺点。然而,传统的粒子群算法和人工鱼群算法在处理多维度的寻优问题时,还存在搜索精度不高、收敛速度较慢的缺点,此类缺点会降低特征选择的性能和效率。针对上述问题,本文将粗糙集理论与智能优化算法结合在一起来开展特征选择的研究。首先,为了解决粒子群算法搜索精度不高和收敛速度较慢的问题,本文将全局最优解和个体历史最优解相结合,提出一种混合最优解的概念,并采用动态惯性因子对现有的粒子群算法进行优化,由此提出一种改进的粒子群算法PSO_DIFHOS。其次,结合引力搜索算法中质量和加速度的概念,提出一种基于引力搜索的人工鱼群算法AFSA_GS,来改善人工鱼群算法后期收敛速度较慢的问题。最后,针对高维数据特征选择效率不高的问题,我们将粗糙集中的粒度决策熵作为算法PSO_DIFHOS和AFSA_GS的适应度函数,并由此构建出两种基于粒度决策熵和优化算法的特征选择方法:FS_GDEPSO和FS_GDEAFS。我们在多个UCI数据集上进行了实验,实验结果表明本文所提出的基于粒度决策熵和优化算法的特征选择方法,较好地解决高维数据上的特征选择问题。本文的主要研究工作和成果如下:(1)基于动态惯性因子与混合最优解的粒子群算法针对传统的粒子群算法搜索精度不高和收敛速度较慢的问题,本文提出一种基于动态惯性因子与混合最优解的粒子群算法PSO_DIFHOS。相对于传统的粒子群算法,PSO_DIFHOS算法进行了如下改进:首先,在惯性因子方面的改进,提出一种能够针对适应度函数动态变化的惯性因子。采用动态惯性因子能够使得粒子在前期的搜索范围更大,而在后期接近最优解时降低其移动速度,从而更有利于最优解的查找;其次,在最优解方面进行了改进,将算法中的全局最优解与个体历史最优解相结合,从而提出一种混合最优解。混合最优解不仅能够有效减少算法的参数设置,而且还能够兼顾粒子群算法的全局与个体特性。(2)基于粒度决策熵与改进粒子群算法的特征选择方法在(1)中所提出的PSO_DIFHOS算法的基础上,本文进一步提出一种基于粒度决策熵与改进粒子群算法的特征选择方法FS_GDEPSO。主要思路如下:首先,采用Sigmoid函数对粒子的位置进行编码;其次,将粒度决策熵作为粒子群算法的适应度函数,基于粒度决策熵计算每个粒子的适应度;最后,通过(1)中所提出的粒子群算法PSO_DIFHOS进行寻优,从所有候选的特征子集中快速寻找到最优的特征子集。我们在UCI数据集上进行了相关实验。实验结果表明,FS_GDEPSO方法的特征选择性能要优于基于传统粒子群算法的特征选择方法以及其他一些具有代表性的特征选择方法。(3)基于引力搜索的改进人工鱼群算法针对传统的人工鱼群算法前期收敛速度快后期收敛速度慢的缺点,本文利用引力搜索算法对传统人工鱼群算法的视野和步长进行改进,从而提出一种基于引力搜索的改进人工鱼群算法AFSA_GS。在此算法中,我们采用了如下两种改进策略:基于引力搜索的自适应感知范围和基于引力搜索的自适应移动步长。首先,使用引力搜索中计算质量的方法对人工鱼群算法的视野进行自适应加权;其次,使用引力搜索中计算加速度的方式对人工鱼群算法的步长进行更新。通过在AFSA_GS算法中引入上述两种改进策略,能够解决传统人工鱼群算法后期收敛速度过慢的问题。(4)基于粒度决策熵与改进人工鱼群算法的特征选择方法在(3)中所提出的AFSA_GS算法的基础上,本文进一步提出一种基于粒度决策熵与改进人工鱼群算法的特征选择方法FS_GDEAFS。主要思路如下:首先,采用Sigmoid函数对人工鱼的状态进行编码;其次,将粒度决策熵作为人工鱼群算法的适应度函数,基于粒度决策熵计算每条人工鱼的适应度;最后,通过(3)中所提出的人工鱼群算法AFSA_GS进行寻优,从所有候选的特征子集中快速寻找到最优的特征子集。我们在UCI数据集上进行了相关实验。实验结果表明,FS_GDEAFS方法的特征选择性能要优于(2)中所提出的特征选择方法FS_GDEPSO以及其他一些具有代表性的基于优化算法的特征选择方法。
其他文献
学位
学位
随着物联网行业的快速发展及人们生活水平提高,对人体健康的要求也越来越高,其中睡眠作为人体健康的支柱之一,睡眠质量的好坏会直接影响人们的精神状态甚至寿命。健康睡眠也是人们对现代生活提出的新的要求。现今取暖方式很多,传统供暖设备像电热毯,采用电热丝进行加热,升温虽然较快,但是存在着温度波动幅度较大的问题,会造成人体水分的加速流失,空调暖气分布不均匀,且电费相对较高;而取暖器在取暖的同时,会造成皮肤干燥
乳腺癌作为世界上最为常见的癌症之一,不仅死亡率高,而且治愈率极低,如今已经成为影响女性健康的头号杀手。在医疗领域,乳腺癌的诊疗主要依靠早发现、早治疗,越早诊疗,患者的临床治疗效果越好。因此,准确识别病灶对于治疗乳腺癌是非常重要的。本文结合机器学习算法,在乳腺肿块穿刺活检量化的病理型数据以及乳腺肿瘤超声图像数据上进行相关研究,针对病人所处疾病的不同阶段,选择不同的辅助诊断模型。本文主要研究内容如下:
学位
随着电动汽车的广泛应用,其充电设备作为必要配套设施也逐渐普及。电动汽车充电设备主要由充电机、充电桩、通信设备以及人机交互设备等组成,结构复杂,工作环境恶劣,易发生故障。由于充电设备在地理位置上分布非常广泛并且分散,这给充电设备的管理、维护等带来很大问题。本文针对电动汽车充电设备的特点,基于.NET平台开发了一套充电设备远程监控系统。该系统可实时监测电动汽车充电设备的工作状态和充电数据,能够及时发现
目前我国人口老龄化问题愈发严重,脑卒中(中风)在老龄化群体中发病率比较普遍,偏瘫是其主要表现症状。近年来因中风偏瘫、交通事故等引起的肢体运动功能丧失的人群逐渐增多,其中就包括手部运动功能障碍。手部包括腕部、掌部和指部,是我们身体最重要的器官之一,在日常生活中发挥着重要作用。传统的手部康复大都是通过理疗师实行一对一康复治疗,劳动量大且成本高,因此康复机器人成为了目前国内外研究的热点。本课题通过查阅大
学位
学位
因矿山爆破不充分导致岩石松动,为防止岩石掉落危害矿井工作人员的生命安全,需要专业人员担任排险工作。针对矿山内部地质情况较为复杂人工排险费时费力且存在一定的安全隐患问题,本文设计一款机器视觉机器人代替人工排险工作,解决了人工成本和矿井工作人员安全问题,推动了矿井排险自动化智能化。本文的主要研究工作如下:(1)本文对机器视觉排险机器人系统做出总体设计方案,通过机器视觉技术实时检测裂缝图像,获取相关图像