SMDP基于性能势的神经元动态规划

来源 :自动化学报 | 被引量 : 0次 | 上传用户:leijian_118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
An alpha-uniformized Markov chain is defined by the concept of equivalent infinitesimalgenerator for a semi-Markov decision process (SMDP) with both average- and discounted-criteria.According to the relations of their performance measures and performance potentials, the optimization of an SMDP can be realized by simulating the chain. For the critic model of neuro-dynamic programming (NDP), a neuro-policy iteration (NPI) algorithm is presented, and the performance error bound is shown as there are approximate error and improvement error in each iteration step.The obtained results may be extended to Markov systems, and have much applicability. Finally, a numerical example is provided.
其他文献
在古代中国灿若繁星的作家群中,李清照是闪烁着奇光异彩的明星。她的词以女性独有的柔美、温顺表现出一番别具一格的神韵,她词作中栩栩如生的形象、独具匠心的语言、精巧和谐
黑河城,是东北边陲重要的沿边开放城市,也是近代东北新兴的重要城市之一。黑河作为北疆重镇,由于其特殊的战略经济地位,它的发展步伐直接紧随国际形势的波动而发生变化。所以对于
口述者:丁国成采访人:李城外时间:2011年8月21日地点:中国作协北戴河创作之家口述者简介:丁国成(1939——),黑龙江肇东人。历任文化部艺术司干部、国家出版局版本图书馆副主
雨夜,天地一萧萧,有诗意漫流于天地间,遂受了这夜雨的邀请,向黑夜深处漫溯。雨是细雨,打在房檐,打在树叶,打在车窗上,发出美妙而细微的叮咚声。夜是无尽的寂寥,只有这雨声落寞地唱着。
第一次见到涛涛,是在摩尔百货。涛涛妈妈短信告诉我,她带着孩子在那里买东西.叫我过来看看。记得那时候的涛涛还是一个精瘦、单薄的小男孩,第一次见到我,有些羞涩。和大多数男孩一
古代诗歌形态纷呈,多姿多彩,如何走进诗歌呢?抓牢诗中线索,顺藤摸瓜,也许是一个行之有效的方法。所谓“线索”,就是穿结诗歌全部内容并促使其发展的枢纽。它通常以显性和隐性两种形
一位语文老师说:“如果去问问中学生喜欢不喜欢写作文,大概有90%的人会说不喜欢。如果我们的学生接受了十几年的语文教育,最后的结果是讨厌作文,只能说我们的语文教育是失败
职业学校的语文教学方法的改革一直是教学改革的重点,本文阐述了行动导向教学的特点、实施方法,以及行动导向教学法在职业学校语文教学中实施的可行性、怎样与传统的语文教学模
诗歌之中常会有一些关键词句,可以称为作品中点睛传神之笔。它有两种表现形式:一种是诗词句中最精炼传神的某个字,以一字为工;一种是全篇最精彩和关键性的诗词句子,是一篇诗词的主
俗话说:一方水土养一方人。其实,一方水土何尝不是滋养着一方的花草树木呢。第一次游历在南海之滨的高原人,不免要惊奇于椰子树之亭亭玉立不旁逸斜出,惊讶于香蕉树大片叶子下