多目标马氏决策过程摄动问题的研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:jo0909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文分别针对离散时间折扣准则MOMDP模型、离散时间平均准则MOMDP以及连续时间折扣准则MOMDP模型的摄动问题给予讨论,并分为两步进行。   首先是MOMDP的最优理论。目前对MOMDP非劣策略的存在性问题主要集中于折扣准则MOMDP,因此本文依据文献[3]、[9]中对多目标问题的讨论方法,将文献[11]、[12]中平均准则MDP及连续时间折扣准则MDP的最优方程理论拓展到平均准则MOMDP及连续时间折扣准则MOMDP中,建立上述模型非劣策略所要满足的方程,从而建立MOMDP的最优理论。   其次,由于MOMDP的摄动问题的研究工作目前主要是从转移概率自身的性质出发,通过考察摄动对转移概率的稳态概率的影响,建立基于摄动的策略迭代法[37[38],以此来寻找决策者对MOMDP的满意策略。而就摄动对模型最优策略及最优准则函数的影响的研究目前还只是针对MDP的(见文献[2]、[4]、[8]),本文将文献[2]、[4]、[8]中对MDP摄动问题的理论向多目标情况进行拓展,即讨论转移概率的摄动后原模型的非劣策略是否依然非劣,以及保证非劣策略依然非劣的摄动限度的问题,并得到结论在一定条件下,摄动对非劣策略以及非劣目标向量的影响可以随摄动因子的变化而变化。   因此,如果控制转移概率或转移速率的摄动在很小的范围内,即决策者认为可以接收的范围,那么,我们运用上述的模型所得到的策略就可以更好地解决实际问题了。文中最后以一个多产品的库存管理为例给出了折扣准则MOMDP摄动理论的一个应用。   
其他文献
本文主要对板方程的一个反问题的全局唯一性和稳定性进行了研究。所采用的方法是:首先借助于一个变换,将原问题转化为对一个带记忆项的板方程的能观性不等式的证明。经过对板方
近年来,安全可靠的群通信已成为研究领域的热点问题,尤其是在基于群的应用和合作领域,群通信越来越受到人们的关注。设计安全有效的密钥管理协议面临着重大挑战。其难点在于
随着城市化进程的急速发展,机动车的保有量激增,城市的交通压力日益严峻。交叉口的道路互相连接构成路网,往往交叉口的交通通行状况直接影响到整个路网的通行效率。而影响信号交
分形几何中由迭代函数系构造分形集的方法推动了由多个理函数生成的动力系统即随机复动力系统的产生.而对由有限多个有理函数生成的随机复动力系统的Fatou集上的动力学性质的
本文着重考虑四个方面的问题。首先本文讨论仿射曲面,归纳R4中具有Klingenberg-横截平面的仿射正定脐曲面。接着,研究局部对称半定空间中具有平行中曲率向量和平坦法丛并且满足
本文主要研究脉冲积分-微分系统{x=f(t,x,Tx),t≠tk,x(tk)=Jk(x(tk-)),k∈N,x(t0+)=x0,(1)的稳定性和有界性,其中Tx=∫t0tK(t,s,x(s))ds,K:R2+×Rn→Rn.脉冲积分-微分系统作为非线
“物流”一词被运用到经济领域以后,是几乎与市场同步存在的一种经济活动。一方面,顾客的广泛性导致了物流企业的差异性;另一方面,大量不同性质物流企业的存在又为顾客提供了弹性
本文主要从两个方面研究了孤立子方程的可积系统:即非线性演化方程族的生成及可积性质和非线性演化方程族的扩展可积模型。第一章介绍了孤立子理论的产生和发展、研究概况及其