论文部分内容阅读
动态优化问题广泛存在于石油化工、航空航天、生物工程等诸多领域。通过动态优化计算方法,获取最优控制策略并加以实施,能够实现提高产品质量、减少生产成本以及确保操作安全等目标。由于其巨大的现实应用价值,动态优化方法的研究引起了学术界和工业界的广泛关注。当前,动态优化研究的难点在于:(1)动态优化问题具有多峰值、多变量以及多约束等复杂特性,而且往往不存在显式数学描述,使得传统动态优化方法难以应对;(2)实际动态优化问题需要兼顾多个优化目标,对动态优化算法的设计提出更大的挑战。进化计算方法是受自然启发而发展起来的一类优化技术,其优点在于不依赖于模型信息,适应性广泛,在处理多峰值、不连续、不含显式描述和复杂多目标等特性动态优化问题上有着独特的优势。本文基于进化计算方法,在控制向量参数化(CVP)计算框架下,对单目标和多目标动态优化方法展开研究,主要研究内容概括如下:(1)基于HGPSO算法的单目标动态优化方法。通过融合粒子群优化(PSO)的全局搜索能力和梯度算法的局部搜索能力,设计了混合梯度粒子群优化(HGPSO)算法,用于单目标动态优化问题的求解。HGPSO算法采用了两阶段搜索框架,即首先采用环形拓扑结构的PSO算法进行全局定位寻优,探索到全局最优解附近时,切换到梯度算法进行局部精确寻优。对比单一的PSO和梯度算法,HGSPO算法在搜索前期基于PSO的全局搜索能力,能为第二阶段的梯度算法提供一个近似最优解的初值,从而有效改善梯度搜索算法初值敏感且较难设置的问题;在搜索后期基于梯度搜索算法快速收敛的特点,相比较单一PSO算法具有更快的收敛速度与搜索精度。在CVP计算框架下,HGPSO算法用于五个难度各异动态优化问题的求解,这些问题包含了奇异、多峰值和多变量等特性。仿真对比结果验证了HGPSO算法在求解精度和计算代价上的优势。(2)基于动态时间网格ndCVP的单目标动态优化方法针对传统等分时间网格控制向量参数化(udCVP)方法存在控制精度低和离散不灵活的缺陷,提出一种新的动态时间网格控制向量参数化(ndCVP)方法。ndCVP方法通过引入分数时间参数的编码方式,有效地处理时间节点的顺序约束问题;同时给出定理,指出ndCVP方法实质上是传统udCVP方法的一般推广。通过结合ndCVP方法和HGPSO算法,提出了求解单目标动态优化问题的ndCVP-HGPSO方法。通过四个动态优化问题的求解结果表明,ndCVP-HGPSO可以根据具体问题的最优轨线特征自动调整时间网格,从而在较小分段数下获取精度较高的控制。此外,ndCVP-HGPSO与udCVP-HGPSO分别在给定区间分段数和优化变量数两种情形下进行了比较,仿真结果表明ndCVP-HGPSO在两种情形下都较优。(3)基于DE-RMO算法的约束单目标动态优化方法差分进化(DE)算法在求解动态优化问题中,存在选择压力低和开采能力差的不足,为此本文在DE算法中嵌入约束排名变异算子,设计了排名变异约束差分进化(DE-RMO)算法,提高了DE算法求解约束单目标动态优化问题的精度和收敛速度。首先基于可行解优先准则设计了用于约束优化的排名变异算子,该算子对整个种群从优到劣进行排序,优秀个体比劣势个体赋予较大的概率参与变异,从而加强了算法的选择压力,提高了算法的局部搜索效率。此外,通过引入状态约束变量的方式来获取总的约束违反度,并采用可行解优先准则处理约束,保证最优解的可行性。在四个约束单目标动态优化问题的求解结果与同类算法的性能对比表明,约束排名变异算子可以在很大程度上加强DE算法求解动态优化问题的精度、收敛速度以及搜索成功率,并且可行解优先准则保证了最优解的可行性。(4)基于MODE-RMO算法的多目标动态优化方法针对多目标差分进化(MODE)算法求解多目标优化问题存在选择压力和开采能力方面的不足,提出了排名变异多目标差分进化(MODE-RMO)算法,并用于无约束多目标动态优化问题的求解。首先通过将非支配排序和拥挤距离引入到排名变异算子中,设计了用于多目标优化的差分排名变异算子;然后将多目标排名变异算子集成到多目标差分进化算法中,提出了MODE-RMO算法。MODE-RMO算法的性能在十个标准多目标测试函数上进行了评估,仿真表明该算法在与其它多目标优化算法的比较中展现了较好的收敛性和分布性,同时多目标排名变异算子加强了算法收敛到分布均匀帕累托前沿的速度。通过结合CVP方法,MODE-RMO算法用于三个无约束多目标动态优化问题的求解,获取了分布均匀的帕累托前沿,为设计者提供了多元化的最优控制方案。(5)基于EPSMODE算法的约束多目标动态优化方法为了加强差分进化算法求解多目标优化问题的鲁棒性,设计了参数和策略集成的自适应多目标差分进化(EPSMODE)算法,并用于约束多目标动态优化问题的求解。MODE算法存在难以设定控制参数和变异策略的问题,为此EPSMODE算法为控制参数和变异策略分别设置了相对应的候选池,通过不同参数策略组合之间的竞争调整它们的使用概率,从而选择更为有益的参数策略组合引导种群进化。同时,Deb约束支配准则被用来处理约束,保证了获取的帕累托解集的可行性。EPSMODE算法用于十一个标准测试函数的求解,仿真结果验证了参数策略集成自适应策略在算法中的有效性。此外,EPSMODE算法还用于两个约束多目标动态优化问题的求解,获取了满意的帕累托前沿,并且帕累托最优控制满足过程约束和终端约束。