论文部分内容阅读
为了统一处理连续时间问题和离散时间问题,1988年,Hilger在他的博士论文中创建了TimeScales(以下称为时标)理论。在此之后,时标理论凭借其优良的时间结构特性及广阔的应用前景,得到了人们的持续关注及深入研究。
现实中有许多过程的时间变量既不是经典的连续时间,也不是均匀离散时间,例如,一个由电阻、电容及自感线圈所组成的简单串联电路,当电容以固定频率作周期闭合时,电路中电流的变化率正好可以用时标上的导数来描述。时标理论所定义的时间尺度适用范围更广,可行性更强,近年来受到了广泛关注。同时,实际控制系统都带有随机因素,在很多情况下,这些因素不可忽略。因此,研究时标框架下的随机最优控制问题具有重要意义,尤其是处理时间变量结构复杂的问题。
本文首次较为深入和系统地在时标体系下研究随机△-微分系统的最优控制问题。相比于经典连续时间和离散时间情形,时标最优控制问题的研究,不仅有助于统一建立包含连续时间和离散时间情形在内的最优控制理论,从而避免连续时间和离散时间之间的重复性研究以及更好地了解这两类不同系统之间的区别及联系,而且对实际优化问题中遇到的时间尺度既包含连续时间区间又包含离散时间孤立点集的动力控制系统提供一定的理论指导。
我们主要研究了两类随机最优控制问题,一类是时标随机线性系统的最优控制问题,分别研究了随机线性二次最优控制问题和平均场型随机线性二次最优控制问题。另一类是时标非线性随机系统的最优控制问题,建立了动态规划原理和最大值原理。关于本文的主要内容,概要如下:
第一章,主要就本论文所涉及问题的研究背景及研究内容展开深入介绍。
第二章,主要介绍时标理论体系的有关内容,为后面研究内容做数学准备。
第三章,由时标随机线性控制系统出发,探讨二次型代价泛函的最优控制问题。为解决此问题,在时标体系下建立了关于随机过程的乘积法则,且通过完全平方方法引入Riccati△-微分方程(R△E)及一个辅助的线性方程,在一定条件下,给出了最优控制的线性反馈形式。受此启发,进一步研究了时标平均场随机线性二次最优控制问题。相较于已有的时标最优控制问题所不同的是,控制系统及代价泛函中均包含状态和控制的期望项。针对状态方程,用迭代法证明了其解的存在唯一性。通过耦合R△Es的解,给出了该问题最优控制的反馈表达形式。另外,我们对R△Es解的存在唯一性问题进行了讨论,并给出了R△Es可解性的充要条件。
第四章,我们研究了随机非线性△-微分系统最优控制问题的动态规划原理。为解决该问题,在时标体系下给出了复合函数链式导数的定义并建立了多元函数的链式法则。以此为基础,重建了关于时标随机过程的伊藤公式,进而借助伊藤公式得到随机最优控制问题的最优性原理和值函数满足的Hamilton-Jacobi-Bellman(HJB)方程。值得注意的是,本文得到的HJB方程比以往研究中出现的相关HJB方程,在形式上要更加复杂,其是一个带期望的二阶偏△-微分方程,原因是离散点出现的时间间断导致此方程包含期望。进一步,将所得时标动态规划原理的结果应用在时标随机线性二次最优控制问题的研究中。
第五章,考虑了两类时标随机非线性控制系统,并分别给出了对应的最大值原理。一类是随机△-微分系统的最优控制问题。在假设控制域是凸集的情况下,通过乘积法则建立对偶关系,从而推导出伴随方程的合适形式,进一步利用变分法并给出时标最优控制问题的最大值原理。其结果退化到离散时间情形下,形式上与传统离散时间情形的结果并不一致,针对这种不一致现象,我们分析并证明了两种结果的等价性。此外,给出了所得时标随机最大值原理在时标随机线性二次最优控制问题中的应用。另一类是受控系统由一个带有条件期望的随机△-微分方程(S△E)给出。我们先由迭代法给出了此类S△E解的存在唯一性,相较于已有的此类方程的结果,我们研究的方程包含更复杂的条件期望项。用凸变分方法给出了控制系统的变分方程以及一些相关估计,这就使得我们可以推导出变分不等式。随后,利用对偶关系给出了变分不等式其等价形式的伴随方程,借助变分不等式的等价形式及其等价形式的伴随方程,本文就得到了最优控制满足的必要条件-最大值原理,其结果退化到离散时间情形下,也是一个新的结果。
第六章,我们将得到的理论结果应用于金融数学问题和季节性种群模型。在金融数学中的一个基本问题是投资策略的构建,其中均值-方差投资组合模型是一类被广泛研究的投资策略。对经典连续时间和离散时间的均值-方差投资组合模型,重构在时标体系下的模型。季节性蚊虫数量的变化规律兼具连续和离散特征,因此在时标体系下建立蚊虫种群密度的控制模型。结果显示,在休眠期开始时施加脉冲控制能够减少来年蚊虫的种群密度。
现实中有许多过程的时间变量既不是经典的连续时间,也不是均匀离散时间,例如,一个由电阻、电容及自感线圈所组成的简单串联电路,当电容以固定频率作周期闭合时,电路中电流的变化率正好可以用时标上的导数来描述。时标理论所定义的时间尺度适用范围更广,可行性更强,近年来受到了广泛关注。同时,实际控制系统都带有随机因素,在很多情况下,这些因素不可忽略。因此,研究时标框架下的随机最优控制问题具有重要意义,尤其是处理时间变量结构复杂的问题。
本文首次较为深入和系统地在时标体系下研究随机△-微分系统的最优控制问题。相比于经典连续时间和离散时间情形,时标最优控制问题的研究,不仅有助于统一建立包含连续时间和离散时间情形在内的最优控制理论,从而避免连续时间和离散时间之间的重复性研究以及更好地了解这两类不同系统之间的区别及联系,而且对实际优化问题中遇到的时间尺度既包含连续时间区间又包含离散时间孤立点集的动力控制系统提供一定的理论指导。
我们主要研究了两类随机最优控制问题,一类是时标随机线性系统的最优控制问题,分别研究了随机线性二次最优控制问题和平均场型随机线性二次最优控制问题。另一类是时标非线性随机系统的最优控制问题,建立了动态规划原理和最大值原理。关于本文的主要内容,概要如下:
第一章,主要就本论文所涉及问题的研究背景及研究内容展开深入介绍。
第二章,主要介绍时标理论体系的有关内容,为后面研究内容做数学准备。
第三章,由时标随机线性控制系统出发,探讨二次型代价泛函的最优控制问题。为解决此问题,在时标体系下建立了关于随机过程的乘积法则,且通过完全平方方法引入Riccati△-微分方程(R△E)及一个辅助的线性方程,在一定条件下,给出了最优控制的线性反馈形式。受此启发,进一步研究了时标平均场随机线性二次最优控制问题。相较于已有的时标最优控制问题所不同的是,控制系统及代价泛函中均包含状态和控制的期望项。针对状态方程,用迭代法证明了其解的存在唯一性。通过耦合R△Es的解,给出了该问题最优控制的反馈表达形式。另外,我们对R△Es解的存在唯一性问题进行了讨论,并给出了R△Es可解性的充要条件。
第四章,我们研究了随机非线性△-微分系统最优控制问题的动态规划原理。为解决该问题,在时标体系下给出了复合函数链式导数的定义并建立了多元函数的链式法则。以此为基础,重建了关于时标随机过程的伊藤公式,进而借助伊藤公式得到随机最优控制问题的最优性原理和值函数满足的Hamilton-Jacobi-Bellman(HJB)方程。值得注意的是,本文得到的HJB方程比以往研究中出现的相关HJB方程,在形式上要更加复杂,其是一个带期望的二阶偏△-微分方程,原因是离散点出现的时间间断导致此方程包含期望。进一步,将所得时标动态规划原理的结果应用在时标随机线性二次最优控制问题的研究中。
第五章,考虑了两类时标随机非线性控制系统,并分别给出了对应的最大值原理。一类是随机△-微分系统的最优控制问题。在假设控制域是凸集的情况下,通过乘积法则建立对偶关系,从而推导出伴随方程的合适形式,进一步利用变分法并给出时标最优控制问题的最大值原理。其结果退化到离散时间情形下,形式上与传统离散时间情形的结果并不一致,针对这种不一致现象,我们分析并证明了两种结果的等价性。此外,给出了所得时标随机最大值原理在时标随机线性二次最优控制问题中的应用。另一类是受控系统由一个带有条件期望的随机△-微分方程(S△E)给出。我们先由迭代法给出了此类S△E解的存在唯一性,相较于已有的此类方程的结果,我们研究的方程包含更复杂的条件期望项。用凸变分方法给出了控制系统的变分方程以及一些相关估计,这就使得我们可以推导出变分不等式。随后,利用对偶关系给出了变分不等式其等价形式的伴随方程,借助变分不等式的等价形式及其等价形式的伴随方程,本文就得到了最优控制满足的必要条件-最大值原理,其结果退化到离散时间情形下,也是一个新的结果。
第六章,我们将得到的理论结果应用于金融数学问题和季节性种群模型。在金融数学中的一个基本问题是投资策略的构建,其中均值-方差投资组合模型是一类被广泛研究的投资策略。对经典连续时间和离散时间的均值-方差投资组合模型,重构在时标体系下的模型。季节性蚊虫数量的变化规律兼具连续和离散特征,因此在时标体系下建立蚊虫种群密度的控制模型。结果显示,在休眠期开始时施加脉冲控制能够减少来年蚊虫的种群密度。