基于多模态多目标差分进化的集成极限学习机算法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:cdhanks1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集成学习作为一类泛化性能强大,稳定性好的机器学习方法已经被应用在很多现实场景中。然而,在构建集成模型的过程中,有以下两方面的任务需要处理:一是如何生成多样化且预测性能强的个体学习器;二是怎样将训练出的个体模型结合成最终的集成模型。生成的个体模型需要满足“好而不同”这两个相互制约与冲突的目标要求,提升其中一个目标的性能往往会牺牲另一个目标的性能。目前,有很多研究采用多目标进化算法来优化这两个冲突目标,但是多目标优化算法难以找到全部的最优解来训练出更多的最优个体模型,所以降低了集成的性能。因此,本文以多模态多目标优化算法为基础、极限学习机为个体学习器,研究了集成学习在构造个体模型与组合个体模型预测方面的问题。研究的具体内容如下:(1)针对多目标进化算法优化个体模型池生成时会出现丢失最优个体模型的问题,以及多模态多目标优化算法能够找到优化问题全部的最优解这一特点,本文提出了一种基于多模态多目标差分进化的个体模型池构建算法。首先,初始化种群,将特征与极限学习机的超参数组合编码为优化算法的个体决策变量;其次,训练一组极限学习机并计算适应度,以个体模型的预测误差和训练数据特征规模的大小作为评价指标;然后,使用进化算子更新种群;最后,迭代直到满足终止条件,得到此时种群训练的最优个体模型池。从UCI数据库中选取10个数据集对算法做测试实验,与传统多目标优化集成个体生成的方法对比,结果证明所提算法能寻找到更多更好的Pareto解,从而训练出更多的最优个体模型。(2)对于集成学习中的个体模型组合问题,本文提出了基于Pareto解的集成学习方法。首先,分析了合适的集成选择有利于降低集成模型的复杂度且不会降低集成的泛化性能。然后,基于多模态多目标差分进化算法优化生成的个体模型池,设计了3种集成选择方案:1)全Pareto集成;2)误差最小集成;3)互补增量集成。接下来,将选择出来的模型预测以多数投票的方式组合成最终的模型输出。最后,实验结果表明与现有的集成学习算法和特征选择算法相比,本文算法具有更好的泛化性能。(3)考虑到现实场景中,获取到的数据通常会出现类不平衡情况,本文对所提基于多模态多目标差分进化的集成学习方法进行了调整与改进,以个体模型的G-means和训练数据特征规模的大小为优化目标,加权极限学习机代替极限学习机作为个体学习器,设计了一种基于多模态多目标差分进化的集成加权极限学习机算法,并用于不平衡数据集的分类问题。从KEEL数据库中选择10个数据集对算法做实验,对比现有的不平衡数据分类算法,结果证明所提算法能获得更好的预测结果。
其他文献
随着我国工业发展的蒸蒸日上,高科技技术应用变得尤为重要。磁悬浮系统就是其中难以攻克的难关,尤其是磁悬浮控制器。作为高铁里程数位居全球第一的中国,若要突破当前高铁速
邮政行业是我国重要的公共服务行业,是我国重要的交通基础设施。一直以来,中国邮政不断提供邮政普遍服务,在经济和社会发展中扮演了重要的角色。邮政普遍服务指的是根据国家
旅游演艺的发展,不仅可以促进旅游目的地无季节旅游的发展,延长游客逗留时间,增加旅游综合收入;同时,还具有促进传统文化创新发展、提升目的地品牌形象等文化与社会功能,是促
融资策略是企业发展过程中的财务管理方面的重难点,可持续增长率与企业的融资策略息息相关。若公司想要完成长期发展的战略目标,就必须要保障其增长是可持续的,即增长不会以
[目的]建立快速、精确、灵敏的UPLC-TOF-MS/MS联用分析方法,通过检测胡黄连苷ⅡI多级质谱离子碎片情况,查阅环烯醚萜苷类化合物质谱裂解规律相关文献,推测胡黄连苷Ⅱ在电喷雾
随着计算系统中任务日益复杂,待处理的数据呈现出计算量大、类型繁多、复杂度高等特点,传统的同构计算系统已难以满足数据处理的需求。为解决算力问题,计算系统逐渐从同构处
黄曲霉毒素主要是由黄曲霉和寄生曲霉等产生的次级代谢产物,在自然界中普遍存在,具有极强的毒性和致癌性等。本论文选择察氏基本培养基,通过氮源替换的方式筛选出产黄曲霉毒素AFB1最高量的氮源谷氨酰胺(Glutamine,Gln),并且还发现4 mM Gln是合成黄曲霉毒素AFB1最高产量的阈值,也是黄曲霉在短期生长中氮源受限的阈值。然而,Gln合成酶抑制剂甲硫氨酸亚氨基代砜却不影响毒素的合成。此外,雷帕
黄曲霉(Aspergillus flavus)是一种机会致病菌,它是造成世界范围内食品污染的重要原因之一。黄曲霉的生长发育以及次级代谢产物的形成受诸多外界环境因素的影响。其中,渗透压是起主要作用的影响因素之一。虽然在酿酒酵母内,渗透压的影响机制已经研究得比较透彻。但是在黄曲霉体内,如何响应渗透压变化以及渗透压改变时如何对产毒进行调控的机制目前还不清楚。所以,本实验进行了黄曲霉高渗甘油途径(HOG)
随着当前社会信息化的发展,多种类型社会网络的建立与使用,极大方便了人们交友、互动、交流、评论等一系列活动。用户使用社会网络是需要进行注册并提供个人信息,包括兴趣,职业或者收入状况等,甚至大部分还需要实名认证。社会网络的出现与发展为科学研究提供了一个很好的平台,去进行各种研究分析,诸如用户行为、社区形成等。然而社会网络数据的公开研究与发布却给用户个人信息的安全隐私带来极大的风险。因此,针对社会网络数
帕金森病(Parkinson’s Disease,PD)是一种多发于中老年人群的神经系统退行性疾病,深部脑刺激(Deep Brain Stimulation,DBS)是一种神经外科治疗PD的方法。目前临床使用的开环