生物地理学优化算法的改进及在聚类优化问题上的应用

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:nvli2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
优化问题无处不在,与人们的生活息息相关。为了高效地处理优化问题,群智能优化算法应运而生。生物地理学优化(Biogeography-Based Optimization,BBO)算法是群智能优化算法之一,其模拟了物种在不同栖息地之间的迁移行为和生态环境的变异现象。BBO算法结构简单易实现,吸引了大量学者关注,并在数据挖掘、图像处理、机械设计等诸多领域得到应用。然而,随着社会的发展和科技的进步,科学和工程领域中所面临的优化问题越来越复杂,对算法性能的要求也越来越高。目前,BBO算法的性能依然有着较大的提升空间。聚类优化是数据挖掘领域的一个重要分支,K-means算法是一种经典的聚类算法,其原理简单,具有较好的可伸缩性和高效性,但也存在K的个数无法确定,对初始点敏感等问题。为此,一些学者尝试用群智能算法解决K-means算法存在的问题。BBO算法性能良好,应用广泛,有潜力更好地处理聚类优化问题,但目前相关研究甚少,因此,BBO算法在K-means聚类优化上的应用有着较大的研究价值。本文介绍了BBO算法和聚类优化的研究背景及意义,描述了BBO算法的步骤,分析了BBO算法存在的主要缺陷,对BBO算法的国内外研究现状进行了简单综述。为了进一步提升BBO算法的性能并拓展其应用,本文针对BBO算法在处理高维和实际复杂问题时性能不强,效率不高和普适性不好的问题,提出了三种BBO改进算法,并应用改进算法处理K-means聚类优化问题。本文主要研究工作如下:(1)为了增强BBO算法的优化性能,提出了一种差分迁移和趋优变异的生物地理学优化算法(DGBBO)。对BBO算法的迁出栖息地选择方法,迁移算子和变异算子分别进行改进,克服了轮赌选择法可能选出较差的栖息地并将其信息分享给较优的栖息地,迁移算子在解空间中可搜索到的位置局限和变异算子可能破坏优质解的缺陷,又从多个角度降低计算复杂度,最终得到改进算法DGBBO。对DGBBO算法进行了计算复杂度分析,并在16个基准函数上进行了仿真实验,对比了其它state-of-the-art算法,实验结果表明,DGBBO算法具有较好的优化性能。(2)为了提升BBO算法的优化效率,提出了一种高效融合的生物地理学优化算法(EMBBO)。首先去掉BBO算法的变异算子,大幅度降低计算复杂度,又对BBO算法的迁移算子进行改进,弥补变异算子的缺失并增强局部搜索能力,然后在改进的迁移算子中融入单维全维交叉更新策略,平衡了探索和开采并进一步降低计算复杂度,接着在算法中融入反向学习机制,一定程度上避免算法陷入局部最优,最终得到高效算法EMBBO。对EMBBO算法进行了稳定性分析,并在21个基准函数和CEC2017测试集上进行了仿真实验,对比了其它state-of-the-art算法,实验结果表明,EMBBO算法具有较高的优化效率。(3)为了更好地处理K-means聚类优化问题,提出了一种生物地理学优化和灰狼优化(GWO)的混合算法(HBBOG)。将BBO算法和GWO算法分别进行改进,增强它们的性能,然后将两种改进算法采用单维全维交叉更新策略进行混合,使它们优势互补,整体上平衡探索和开采,最终得到混合算法HBBOG。对HBBOG算法进行了全局收敛性分析,并在30个基准函数和9个聚类数据集上进行了仿真实验,对比了其它有竞争力的算法,实验结果验证了HBBOG算法的普适性,表明HBBOG算法在处理K-means聚类优化问题上整体表现最佳。3项研究在算法设计方面:第一项研究是在BBO算法的基础上提出的创新性改进,重点强调算法性能的提升;第二项研究是在第一项研究的基础上,借鉴了部分创新性改进,又提出了新的改进,不仅强调算法性能的提升,还强调了计算复杂度的大幅度降低,从而达到算法优化效率高,可操作性强的目的;第三项研究是在第二项研究的基础上,借鉴了部分创新性改进,又提出了新的改进,除了强调算法性能的提升外,还要求算法能处理更多类型的优化问题,最终达到普适性强的目的。3项研究在实验设计方面:第一项研究在一组常用的基准函数上进行了实验;第二项研究在更多基准函数上进行了实验;第三项研究不仅在基准函数上进行了实验,还测试了聚类数据集。整体上,3项研究遵从由算法的简单改进到复杂改进,由单一改进研究到改进和应用综合研究的逻辑关系,后者较前者的改进更加完善,算法性能更加优秀,实验内容也更加丰富,这也对应了本文研究由浅入深的过程。
其他文献
SDN(Software Definded Network,软件定义网络)是一种新型的网络创新架构,它是实现网络虚拟化的方式之一,SDN的出现实现了网络设备控制层与转发层的分离。从而通过SDN控制器
Takagi-Sugeno-Kang(TSK)模糊系统在处理高维非线性建模任务时,通常需要更多的模糊规则数,这也进一步降低了其清晰度和解释性,所以本文研究如何稀疏模糊建模。随着异构数据的
由于用户对数据的安全性和隐私性的要求不断提升,越来越多的企业用户开始建设自己的私有云平台,其中以云桌面(Cloud Desktop)应用最为典型。为了增强云桌面的用户体验,向用户
在过程工业中,很多关键的质量参数无法实时在线测量,只能通过实验室离线分析获得,严重制约了过程的监测、控制及优化水平。为此,软测量技术通过建立易测变量与难测变量之间的
数据分析技术在各个领域应用广泛。其中,聚类分析作为一个重要研究方向,获得了极大的发展。数据竞争(Data nCompetitio,DC)算法是一种基于划分的聚类算法,能够排除孤立点带来
当前,互联网的应用模式已经从发送者驱动的点对点通信为主转向接收者驱动的大规模信息获取为主。内容中心网络(Content Centric Network,CCN)顺应这一应用模式的转变,实现了
科技不断发展,各门学科与计算机领域的结合越来越紧密,图作为重要的数据结构,其应用范围不断拓广。蛋白质网络,社交网络以及电子商务网络等,都是以图进行建模的数据。随着互
研究背景:寨卡病毒(Zika virus,ZIKV)是一种蚊媒传播病毒,可引起ZIKV病。人感染ZIKV后严重可导致成人格林巴利综合征;孕妇感染病毒后可能引起新生儿小头畸形。2016年ZIKV病在
由于计算机科学技术的飞速发展,使得网络越来越复杂和多样化,这给网络和信息系统的安全管理带来了新的挑战。单一使用“检测”、“容忍”网络和信息技术难以保证网络在无干扰
介数中心性计算是复杂网络分析中的一个基本问题,它用来衡量一个节点在复杂网络中的重要程度。近年来,介数中心性已经广泛用于社交网络分析,打击恐怖组织网络,治理城市交通网