MDP中模型的转换—平均模型

来源 :西安电子科技大学学报 | 被引量 : 0次 | 上传用户:feihuiy1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文讨论状态可数的平均报酬马氏决策规划(Markov Decision Programming,简记为MDP),通过模型的转换,文中将半马氏决策规划和连续时间MDP分别转换为离散时间MDP.转换保持模型间的最优方程等价,后一转换甚至保持平均目标函数等价。因此,离散时间MDP申的大部分结论可轻易地推广到另两类MDP中去。最后本文讨论了π<sub>0</sub><sup>∞</sup>为最优策略与最优方程的关系。
其他文献
环缝焊机工作时,筒状工件由床头床尾带动做圆周旋转运动。由于筒状工件长度长、壁厚薄,因此设计了环缝焊接机辅助支撑装置,在筒状件进行加工及焊接时起支撑作用。根据实际生产情
在中国新文学史上,朱自清先生是一位著名的散文作家。他的散文具有独特的风格,尤其表现在语言上。本文主要从三个方面谈起,一是语言的淡雅、二是语言的谈话风、三是语言的幽
大力值叠加式力标准机研究中,主承载结构、标准传感器(组)、力源系统及控制系统等对整机的计量准确性和可靠性起着重要作用。随着高精密度液压控制、软件算法、自动化智能控
在新形势新经济形态下,电力无论是在工业生产还是在人民生活中都扮演着越来越重要的作用,我国人口众多,疆域辽阔,如何安全的实现远距离供电配电是非常重要的挑战。配网安全问
子集和问题是NPC问题,可用Lenstra等人提出的L^3-算法以较大概率求解,但其成功率往往受到问题规模和误差积累的限制。对此该文提出了再开始技术,利用神经网络算法对L^3-算法进行改进,并采用装配整型
随着时代的发展,自20世纪爆发了能源危机以来,人们开始寻找新的能源以期支撑社会稳定运转,方便人们正常的工作和生活。近年来,随着国家经济实力的提升,社会经济发展势头越发
现代交通运输主要包括铁路、公路、水运、航空以及管道运输等多种方式,各个不同的运输形式在其固定的环境中以不同的形式为国民经济的发展服务。与其他运输方式相比,水运运输
根据国家"十二五"发展规划提出的"优化发展火电,上大压小"发展思路,当前国家能源结构中火电仍占有主导地位(约占70%)。大型火电机组将是未来火电机组的主要构成,仍然在近十年保持较
随着计算机的普遍使用,网络、系统的快速发展,企业信息化已成为一种趋势,而企业档案的电子化属于企业信息化的内容之一,也是一种信息资源,为适应这种发展趋势有效的管理这种
为遵守国际足联的规定,巴西特意对2014国际足联世界杯决赛赛场——马拉卡纳体育场进行了改建,以确保观众的安全。著名的屋顶和建筑外膜设计公司Hightex(总部位于德国巴伐利亚基