平稳策略相关论文
本文共分为六章: 第一章为综述,简单介绍了离散时间随机对策的历史背景、研究内容、发展现状以及本文的研究目的和主要结果. 第......
本文共分为六章. 第一章为综述,简要介绍了马尔可夫决策过程的历史背景,连续时间马尔可夫决策过程、离散时间马尔可夫决策过程和受......
本文主要是研究离散时间马尔可夫决策过程最优平稳策略的灵敏度分析及其应用。 全文主要内容由理论基础和实例应用两部分组成。......
众所周知,迄今我们在解多阶段随机规划时所遇到的困难是由于这样一个事实的复合作用而产生的,即可能的实现值的个数随着阶段数的增......
本文讨论了离散参数马氏规划(简记为DTMDP)的最优策略存在问题,对状态空间和行动集均为可列集的模型,给出了保证平稳最优策略存在......
考虑的是任意状态空间,任意行动空间MDP平均模型的四个平均准则,在O.H.Lerma的遍历性条件下,利用稳定性定理和可测选择理论简明地证明了存在平稳策......
本文定义了折扣因子可以取不同值的折扣多目标马氏决策规划(DMOMDP),讨论了它的马氏策略(П_m~d)与平稳策略(П_s~d)的优势及局限......
本文独立研究了一类疲软商品的动态降价问题,在两种常见投资方式下归纳出了数学模型,并用反例说明平稳策略未必是最优的。......
多阶段随机规划的求解是一项很困难的工作。本文首次给出了它的一类比较简单易求而又较好的可行策略,证明了这类策略是平稳策略,它可......
市场有效性假说是传统金融理论的一个基本假设,很多模型的推导都是基于这个基本假设,但近年来越来越多的研究表明,市场有效性在有......