论文部分内容阅读
在现实生活中,人们面临着各种各样的非决定性现象。例如气温的变化,股票、市场需求的波动状态等,对于决策者而言,这些都是非决定性因素。作为实际问题的提炼,控制系统在运行中不可避免的会受到非决定性因素的干扰。如何描述和预测非决定性现象,是人们所需处理的关键问题。概率论作为研究随机现象的一个数学系统,其应用是非常成功的,如果持有充足的样本数据,就可以使用统计的方法获得概率分布从而充分接近其真实频率。然而,由于实际情况的限制,面对的许多非决定性现象有时无法掌握充足的样本数据,或者根本就没有样本数据,于是只能依靠领域专家估计出各种事件发生的信度。为了合理地处理这类非决定性现象和专家的信度,清华大学的刘宝碇教授于2007年建立了一套公理化的数学系统——不确定性理论,用不确定变量来刻画非决定性现象。在不确定微分方程的基础上,朱元国教授于2010年提出了期望值判定准则下的不确定连续系统的最优控制问题。然而,在某些情况下,根据问题的实际需求,必须考虑不确定变量的其它数字特征。本文考虑运用关键值判定准则去优化控制问题的目标函数,从而研究不同的不确定最优控制模型及其在实践中的应用。 本篇论文的创新点主要有: 1、研究了一维不确定连续系统的最优控制问题,在一定的置信水平α下,运用α-乐观值判定准则去优化问题的目标函数,从而建立不确定最优控制乐观值模型,给出求解模型的最优性原理进而推导出最优性方程。然后考虑多维情形,证明了多维最优性方程,并将其应用到不确定bang-bang控制问题中。与期望值模型中的最优性方程相比,乐观值模型最优性方程更多地考虑了扩散项对于最优解的影响。 2、在Hurwicz决策准则的启发下,把两种关键值(乐观值和悲观值)进行综合,给出一个新的判定准则去定义不确定变量的序关系。建立了Hurwicz不确定最优控制模型,推导出了求解模型的最优性方程以及无限时间情形下的现值公式。应用现值公式和不确定分析研究了一类具有控制约束的线性二次不确定最优控制问题。 3、研究了不确定多阶段系统的最优控制问题,建立多维多阶段乐观值模型,并运用动态规划方法推导出寻找最优控制序列的递推方程。然后考虑无法得到解析解的一般问题,设计了结合不确定模拟、人工神经网络以及遗传算法的混合智能算法求解递推方程从而给出问题的数值解。 4、考虑多维多阶段悲观值模型和最大机会模型,并在原不确定多阶段最优控制问题中加入了终端状态约束,借助系统的生存性分析,给出了同时满足动态方程和终端约束的生存核以及生存控制集,分别作为状态与控制的可行集,然后在可行集上对不确定目标函数实现最优化。 5、研究不确定最优控制模型在实际问题中的应用,分别考虑了金融经济学中的证券投资组合问题和现金余额问题、生产计划中的技术扩散问题和生产库存管理问题、以及环境管理科学中的二氧化碳减排问题。