自适应信息反馈模型改进的MOEA/D算法

来源 :赤峰学院学报·自然科学版 | 被引量 : 0次 | 上传用户:pearwj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
   摘 要:为了提高MOEA/D算法求解大规模高维多目标优化问题的能力,本文提出一种基于自适应信息反馈机制改进的MOEA/D算法,其基本思想是根据信息反馈原理,将当前代第k个个体与用MOEA/D算法求得的第i个个体加权平均后作为下一代第i个个体。k的选取有指定和随机两种方式,可以根据目标函数的梯度自适应地选择。采用标准的测试函数来评测改进后的算法的性能。结果表明,改进后的MOEA/D算法在收敛性方面有明显的提高。
   关键词:大规模高维多目标优化;MOEA/D;信息反馈;自适应;目标函数梯度
  中图分类号:TP391  文献标识码:A  文章编号:1673-260X(2021)04-0025-04
   当多目标优化问题中的目标函数的个数有二至三个时,此类优化问题被称为多目标优化问题(Multi-objective Optimization Problems,MOP);当优化问题中的目标函数的个数达到4个以上时,此类优化问题则被称为高维多目标优化问题[1](Many-objective Optimization Problems,MaOP)。多目标进化算法(Multi-objective Evolutionary Algorithm,MOEA)是求解MOP非常经典的优化算法,但是在用于求解MaOP时,算法的性能就会有一定程度地下降,不足之处主要表现在随着目标函数个数的增加,进而导致算法的收敛性不足,Pareto最优前沿不能完美地逼近真实的Pareto前沿,并且解的分布性和均匀性也欠佳。
   基于分解的MOEAs根据分解的形式可分为基于聚合函数的MOEAs和基于参考向量分解的MOEAs[2]。基于分解的多目标进化算法中具代表性的算法是MOEA/D。Zhang提出了基于多目标分解的MOEA/D[3];为了改善计算资源的分配,Zhang提出了改进的MOEA/D,称为MOEA/D-DRA[4];在MOEA/D-DRA的基础上,Zhou和Zhang提出了MOEA/D-GRA[5];Ryoji[6]分析了MOEA/D的控制参数;Dong[7]提出了自适应权重MOEA/D。Zhang和Wang[8]提出了一种基于信息反馈的改进MOEA/D。
   Zhang和Wang将信息反馈模型中参数k的两种选择方式对应为两种不同的算法,分别研究了这两种算法对MOEA/D的改进[8]。考虑到参数k的两种选择方式的优缺点,本文提出了一种针对参数k选择方式的不同来进行自适应地确定参数k选择方式的算法,具体做法就是利用目標函数的梯度,来构建自适应性选择,从而确定参数k的选择方式。对改进后算法的性能,一般用标准化测试函数对其进行评测,并将改进后算法得出的结果和MOEA/D算法产生的结果相比较。
  1 MOEA/D算法
   在MOEA/D算法中,权重向量的生成方式是多种多样的,可以根据自己的需求预先设置权重向量,再利用权重向量将复杂的多目标优化问题转换成一个一个的单目标问题,每个子问题进化所需要的参考信息是由相邻的子问题来提供,子问题与其相邻的子问题依据参考信息相互协同进化。MOEA/D主要用于求解MaOP。该算法采用Tchebycheff分解法,MOEA/D的基本步骤如下。
   步骤1 初始化:
   (1)设EP=?椎。
  (3)根据权重向量生成初始种群x1,x2,…,xN。令FVi=F(xi)。
   (4)采用基于问题的特定方法初始化z=(z1*,z2*,…,zm*)。
   步骤2 更新:
   (1)从B(i)中随机选取两个序号k,l,运用遗传算子由xk和xl产生一个新的解y。
   (2)对y运用基于测试问题的修复和改进启发产生y′。
   (3)若zj<fj(y′),则zj=fj(y′),j=1,2,…,m。
   (4)若gte(y′|u,zu*)≤gte(xu|u,zu*),u∈B(i),若xu=y′,FVu=F(y′)。
   (5)剔除EP中受y′支配所有的向量,并且在EP中向量都不支配y′时,令EP=EP∪{f(y)}。
   步骤3 终止条件:如果满足终止条件,则停止并输出EP,否则转步骤2。
   其中,N是子问题的个数;?姿1,?姿2,…,?姿N是权向量;T是每个权重向量的邻域中含有权重向量的个数;EP是最优解的集合,?椎是空集。
  2 信息反馈MOEA/D算法
   数值实验表明,MOEA/D算法在求解大规模高维多目标优化问题时,会面临比较复杂的Pareto最优解,会导致算法收敛速率慢,并且在同等评价次数情况下,求解质量不高[8]。
   Wang[9]提出信息反馈机制策略,并将其引入启发类算法中,从而提高算法的收敛性。Zhang[8]年研究如何将信息反馈机制引入到MOEA/D算法中,来改善算法在求解大规模高维多目标优化问题时性能不佳等状况。
   信息反馈机制的原理类似于求解线性方程组数值解法中的超松弛法,本质是第t代个体经过MOEA/D算法后,产生的个体是不能作为第t+1代的个体,只能是作为一个中间个体。将此中间个体与第t代中的若干个体,按一定的规律进行加权平均后得到新的个体,才能作为第t+1代的个体。在信息反馈机制中,由于中间个体可以和第t代若干个体进行组合,那么到底从第t代中选取多少个个体以及怎样选取个体,这会产生多种信息反馈模型。
   为了避免增加算法的复杂性,从第t代中选取个体的数目一般不要超过3个,并且从第t代选取个体有两种选取方式,即固定方式和随机方式,因此产生6种信息反馈模型。
   虽然信息反馈模型有不同的形式,但是它们的结构基本上是相似的,而本文只研究从第t代选取个体的数目为1时的情形。    当从第t代选取个体的数目为1时,此时信息反馈模型可以按如下的方式定义[8]:
   其中,xkt是第t代种群中的第k个个体,uit+1是用MOEA/D算法求出的中间个体,xit+1是第t+1代种群中的第i个个体,f表示个体对应的适应度。
   很明显,xit+1就是由xkt和uit+1加权平均生成的,并且权重?兹1和?兹2与适应度相关。有两种方法可以对k进行确定:第一种是固定方式,即令k=i;第二种是随机方式,即k=rand(1,2,…,N)。固定方法即为数值计算中的松弛法,可以起到对算法进行加速的作用。
   在MOEA/D中,利用信息反馈模型来对种群进行更新,即可得到信息反馈MOEA/D算法。
  3 自适应信息反馈模型改进的MOEA/D算法
   Zhang和Wang提出了6种信息反馈模型[8],并且利用这些模型对MOEA/D算法进行改进,得到6种改进后的MOEA/D算法,而MOEA/D1算法(固定方式选取第t代中一个个体)相较剩下5种算法而言,属于模型改进后效果最好的算法,让其产生的结果与其他相关算法产生的结果做了比较。
   下面对种群的更新方式加以分析,信息反馈模型中的参数k的两种选取方式各有优劣。固定方式是最符合常理,也是最自然的方式。采用此方式的算法,其收敛速度是比较快的,但是会面临一些问题。比如当uit+1与xkt接近时,算法会陷入局部最优,非常容易导致算法早熟。此时,要想使算法跳出局部最优,只有靠随机方式。因此在改进MOEA/D算法时,最佳方案是将固定和随机这两种方式根据具体情况进行自适应地结合,这样既能够保证算法收敛速度加快,又能尽量避免算法陷入局部最优。
   基于上述的讨论,本文提出了自适应信息反馈模型,将其应用在MOEA/D算法中。而构造自适应信息反馈模型的关键就在参数k的选取方式上,让参数k根据算法自身收敛的状况,来自行确定参数 的选取方式,即自适应性选择。自适应的构造如下:
  在进化的前期和中期,?滓值是控制算法过早收敛重要因素。因为当公式(3)计算出的?籽ab值小于预先设定的临界值?滓(?滓的取值是10-2)时,算法可能会陷入局部最优的状况。这时让信息反馈机制中的参数k按照随机的方式进行选取,这样能使算法跳出局部最优状况。如果算法没有陷入局部最优状况,那么信息反馈机制参数k的选取就用固定的方式。在进化后期,为了避免算法的收敛性遭到破坏,要根据算法收敛的情况,适当地放弃随机性的选择方式,直接采用固定的方式进行选择。另外,要在程序中将总进化代数的后20%为设置为进化后期。
   将自适应信息反馈模型应用到MOEA/D算法中,得到自适应信息反馈MOEA/D算法(MOEA/D based on adaptive information feedback, MOEA/D-AIF),简记为MOEA/D-AIF。此间具体步骤如下:
   步骤1 初始化种群。
   步骤2 种群更新。
   (1)将父代种群Pt,经过MOEA/D算法得到个体uit+1。
   (2)根据目标函数梯度自适应来确定信息反馈方法,即自适应地确定k的选取方式,再根据公式(1)和(2)生成子种群Qt。
   (3)将Pt和Qt合并,记为Dt。
   (4)对Dt再利用MOEA/D算法,生成下一代父代种群Pt+1。
   步骤3 达到设定值时,停止此循环并输出结果EP。否则循环回到步骤2。
  4 数值实验与算法性能评测
   为了评测本文提出的基于自适应信息反馈机制的MOEA/D算法的性能,用此算法对两个标准测试函数DTLZ1和DTLZ2进行数值实验,并将实验结果与经典的MOEA/D算法的优化结果进行了比较。
  4.1 DTLZ1测试函数
   M=3时两者的PF如图4所示。
   为了更准确、定量地衡量本文算法的性能,下面给出基于自适应信息反馈机制的MOEA/D算法和常规MOEA/D算法的世代距离(GD)和分散性(SP)两个指标的对比数据。其中,GD指标反映的是算法的收敛性,而SP指标则描述了解的分布性。由于计算结果有随机性,表1、表2中数据为GD指标数据和SP指标数据计算结果的平均值。
  5 结论
   图3-6直观显示,基于自适应信息反馈机制的MOEA/D算法的解明显优于常规MOEA/D算法的解。表1和表2中的指标进一步表明,MOEA/D-AIF算法与常规MOEA/D算法相比,SP指标相差不大,但GD指标明显占优。
   综上,可以得出明确的结论:基于自适应信息反馈机制的MOEA/D算法较常规MOEA/D算法在收敛性方面有明显提高,分布性和均匀性也有一定程度的改进。
  参考文献:
  〔1〕孔維健.高维多目标进化算法研究综述[J].控制与决策,2010,25(03):321-326.
  〔2〕袁源.基于分解的多目标进化算法及其应用[D].清华大学,2015.
  〔3〕Zhang Q. F Li H. MOEA/D: A multiobjective evolutionary algorithm based on decomposition[J]. IEEE Transactions on. Evolutionary Computation., 2007,11(06):712-731.
  〔4〕Zhang Q, Liu W, Li H. The performance of a new version of MOEA/D on CEC09 unconstrained MOP test instances [A]. Evolutionary Computation, 2009[C]. 2009, 203-208.
  〔5〕Zhou A, Zhang Q. Are All the Subproblems Equally Important? Resource Allocation in Decomposition-Based Multiobjective Evolutionary Algorithms [J]. IEEE Transactions on Evolutionary Computation, 2016, 20(01): 52-64.
  〔6〕Ryoji Tanabe, Hisao Ishibuchi. An analysis of control parameters of MOEA/D under two different optimization scenarios [J]. Applied Soft Computing, 2018, 70: 22-40.
  〔7〕Zhiming Dong, Xianpeng Wang, Lixin Tang. MOEA/D with a self-adaptive weight vector adjustment strategy based on chain segmentation [J]. Information Sciences, 2020, 521: 209- 230.
  〔8〕Yin Zhang, Gai-Ge Wang, Keqin Li. Enhancing MOEA/D with information feedback models for large-scale many-objective optimization [J]. Information Sciences, 2020, 522: 1-16.
  〔9〕G. Wang, Y. Tan, Improving metaheuristic algorithms with information feedback models [J].  IEEE Trans. Cybern., 2019, 49(2): 542-555.
其他文献
广泛应用的热水储能供热系统中,用热侧和储热侧的流量、温度相互耦合,从而限制了储热温度,导致储热效率不高,运行调节过程中储热量与供热量分配不合理。为了解决以上问题,本
在国民经济增长和社会文明进步的发展背景下,大众的艺术审美追求也在日益提高,音乐表演服装艺术作为艺术文化表演的重要组成形式同样获得了良好的发展机遇,并逐渐形成了独具
以Windows10操作系统为平台,以WinHex为工具,通过对GPT磁盘整体结构的分析,以实验的方式研究了在GPT分区表及其备份均被破坏的情况下,通过查找各个分区的位置信息来重建GPT分
根据浙江省仙居县1983年至2001年马尾松毛虫历史资料,应用多元线性回归方法对发生面积进行预测,并对数据累计序列、新陈代谢序列和数据优化序列建模预测,并对其进行了比较分
应用ABAQUS有限元软件,对已完成的多腔钢管混凝土短柱试验试件建模并进行非线性计算。分析其在轴压荷载作用下的受力性能,将有限元得出的破坏形态,荷载-位移曲线与试验结果进
随着科学技术的蓬勃发展,我们日常生活中的信息数据量越来越大,为了从这些数据中提取出有用的信息,大数据的收集和分析就显得尤为重要。介绍利用python爬取新冠肺炎的数据并
“人人生态·人人公共”是新时代下人与人、人与自然、人与社会之间和谐共生的公共艺术内涵追求。本文立足于“2020年重庆生态艺术季组合展暨第三届长江上下公共艺术行动计划
汽车变速器的振动噪声已逐渐成为汽车振动噪声的主要来源之一,引起变速器振动噪声产生的激励源有很多种,其中,以轮齿啮合时产生的内部激励对振动噪声的影响最为显著。因此,以
基于信息化发展下档案个性化服务面临着资源的结构不平衡、服务的方式单一、需求多样性以及网络空间的复杂性等问题。本文引入治理理念,从治理的角度研究档案个性化服务,具有
探讨无醛磷氮阻燃剂的合成条件及其应用于亚麻织物的阻燃效果。以亚磷酸二乙酯和三聚氯氰为原料,通过改变亚磷酸二乙酯与三聚氯氰摩尔比、反应温度、反应时间等条件,制得系列