【摘 要】
:
特征选择是机器学习领域中研究最早的分支领域之一,是一个非常重要的数据预处理过程,也是常用的数据降维方法之一,被广泛的应用于一系列现实问题,如分类,手写识别等。特征选
论文部分内容阅读
特征选择是机器学习领域中研究最早的分支领域之一,是一个非常重要的数据预处理过程,也是常用的数据降维方法之一,被广泛的应用于一系列现实问题,如分类,手写识别等。特征选择是指从原始特征集中选择使某种评估标准最优的特征子集,其最终目的是根据一些评选准则移除不相关、冗余特征,选取出最小的特征子集,使得任务如分类、回归等达到和特征选择前近似甚至更好的效果并且提高算法的泛化能力。演化算法是一类模拟自然界遗传进化规律的仿生学算法,尤其适合于处理传统搜索方法难以解决的高度复杂的非线性问题。随着演化算法被证实适合优化问题,进化算法(EA)、粒子群优化算法(PSO)、蚁群算法(ACO)在特征选择领域的应用已经取得令人满意的成果。为更好地解决特征选择问题,Manizheh Ghaemi等人提出了一个较新的、高效的、具有全局搜索能力的森林优化特征选择算法FSFOA。相比其他算法,FSFOA算法通常只需较小的计算代价就可达到较高的分类准确率,并且具有很好的泛化性能。虽然如此,但仍有一些不足之处。在FSFOA方法中,初始化阶段的随机性、更新机制上的局限性及局部播种阶段新树的劣质性严重限制了该算法的分类性能和维度缩减能力。受Ini PG,MFOA算法的启发,本文针对FSFOA算法的不足之处进行改进。在FSFOA算法的初始化阶段,我们采用新的初始化策略,利用前向选择和后向选择的优点,摒弃其缺点,形成双向选择的策略;在更新机制上,克服传统更新机制的局限性,将维度缩减问题也纳入考虑范围;在算法的局部播种阶段,为避免森林中存在过多劣质树,增加搜索难度,影响分类性能,我们采用了极度贪婪的策略,从而形成一个新的特征选择算法IFSFOA,在最大化分类性能的同时最小化特征个数。在改进算法过程中,为了避免因极度贪婪策略导致算法陷入局部最优问题,在IFSFOA算法中,将全局播种阶段作用的对象由侯选森林改为由候选森林和森林中所有Age为0的树共同确定,但改变前后用在全局播种阶段的树的数目并未改变,这样就使得同一颗0-Age树既可以局部播种,又可以全局播种,一定程度上解决了因极度贪婪策略而带来的易陷入局部最优解问题。实验阶段,IFSFOA使用SVM,J48和KNN分类器指导学习过程,通过机器学习数据库UCI上的小维,中维,高维数据集进行测试。实验结果表明,与FSFOA相比,IFSFOA在分类性能和维度缩减上均有明显提高。将IFSFOA算法与近几年提出的比较高效的特征选择方法进行对比,不论是在准确率,还是在维度缩减上,IFSFOA仍具有很强的竞争力。
其他文献
在资本主义市场不断发展的趋势下,传统的融资方式渐渐进入“瓶颈期”,控股股东股权质押逐渐成为我国资本市场上一个非常普遍的现象,在银行信贷和大股东减持受到限制的背景下,股权质押作为一种灵活性较高的融资方式成为缓解公司融资问题的有效方式。但是,随着股权质押发展的繁荣,股权质押带来的弊端逐渐显露。频繁滚动的股权质押行为,不仅无法促进公司经营发展,反而导致公司经营问题频发。股权质押融资对于控股股东来说存在许
炉缸活性就像高炉生产的“心脏”,如果炉缸活性出现问题,不仅会使得高炉寿命缩短,还会破坏高炉的稳定运行,这将给企业带来巨大的经济损失。目前,炉缸活性的量化计算仅仅从经验公式的角度进行,经验公式的参数获取困难且无法实现炉缸活性的预警功能。针对这一问题,本研究提出使用高炉实际运行中的操作参数数据,采用数据挖掘方法来预测高炉炉缸活性。具体包括:(1)数据处理及模型评价标准。首先简要介绍数据获取的方式及途径
随着我国现代社会学科的兴起,《山海经》的学术价值和文化价值日益凸显。《山海经》一书,虽然仅有三万一千字,但却被古往今来的诸多学者视为我国古代神话之权舆、宗教之萌芽、美学之渊薮,更有很多学者将其视作上古生活百科全书。晋朝的郭璞、清代的郝懿行和毕沅等人都对《山海经》进行了详尽的校对和注释。近年来,学者们以更加全面的角度对《山海经》进行系统的研究,其中涉及到学术领域的诸如地理、天文、民族、动物、植物、矿
越级上访治理工作的开展是连接基层群众与上级职能政府和职能单位的桥梁。人民群众可以通过信访的方式去争取、反馈自身的合法合理诉求,维护自身的利益;政府机关可以通过信访的渠道了解到基层群众主要集中的矛盾、突出问题。近年来,为了更好的维护基层主体的社会稳定,营造和谐良好的基层发展繁荣事态,越级上访治理工作一直作为一项重要的基层治理手段和政府职能工作来抓。但由于基层群众维权意识的日益增强与群众运用法律手段解
角色游戏能促进幼儿认知、语言、情绪情感等多方面能力的的发展,是幼儿期的典型游戏,是学前期儿童最主要的活动之一,其蕴含的教育价值不容忽视。教师的有效指导能促进角色游戏教育价值的实现,但在教育实践中,教师的指导行为还存在许多问题,特别是缺少教学经验的新手教师,因此,研究新手教师对幼儿角色游戏的指导行为具有重要的意义。本研究通过了解新手教师在角色游戏开展前、过程中、结束后的指导现状,发现新手教师在指导角
从改革开放以来,我国的经济水平、科技水平和综合国力不断提高,基础建设迎来了一个翻天覆地的变化。2019年建成了主跨世界第二的武汉杨泗港长江大桥,我国进入了悬索桥建设的新时期,建造的悬索桥跨度越来越大,桥址越来越复杂,桥梁也面临更复杂的受力情况,因此我们需要对桥梁结构进行更深入的研究。本文在国内外的相关研究基础之上,以一座在建的主跨808m的悬索桥为工程背景,所做的主要工作如下:(1)根据有限元原理
随着我国水利工程的高速发展,已建成多座齿爬式升船机,建造的位置多位于地震带,不可避免地会遭受不同烈度的地震冲击,齿爬式升船机中的承船厢及横/纵导向系统作为地震波传递过程中必经的结构,其损坏情况必然会对升船机震后的运行存在安全隐患,所以提出以应力损伤比差作为损伤指标的齿爬式升船机承船厢及横/纵导向系统地震损伤评价方法以及研究损伤识别模型,对震后的检修、维护工作具有一定的参考价值。本文开展的主要工作及
本文主要研究了压缩感知(Compressed sensing,CS)领域中的信号重构算法,其可分为三类:手工设计方法、数据驱动方法以及模型驱动方法。手工设计方法依赖于目标信号的先验信息,通常具有可理解性。如近似消息传递算法(approximate message passing,AMP)以及广义近似消息传递算法(generalized approximate message passing,GAM
随着大型跨国快消品企业不断进入中国,加之国内该行业本身激烈的竞争,国内快消品行业不断受到冲击。在这种双重影响下,国内的快消品企业都期望在变幻莫测的市场上有立足之地
从《中华人民共和国政府信息公开条例》2008年开始实施至今,N市政府按照《条例》要求依法履职,多措并举,持续推进政府信息依申请公开,已经取得初步成效,申请通道不断优化,答复结果也更加透明,公众知情权得到了进一步的保障。但是随着此项工作的不断深入推进,由于行政机关及公众思想认识的错位、工作机制的不完善和监督制约效能的不足,导致N市政府信息依申请公开面临各种实施阻力和障碍,如缺乏配套制度及高效工作机制