一类事件驱动马氏决策过程的Q学习

来源 :系统工程与电子技术 | 被引量 : 0次 | 上传用户：xjp_djx

【摘要】

：

对广泛存在的一类事件驱动的平均费用型马尔可夫决策问题，通过分析其模型特征，研究了一种简单的增强型学习算法，不必将事件扩充为系统状态，而只对原始状态的值函数进行学习，减少了

【作者】

：

王利存郑应平

【机构】

：

中国科学院自动化研究所,同济大学CIMS研

【出处】

：

系统工程与电子技术

【发表日期】

：

2001年4期

【关键词】

：

马氏决策过程马尔可夫过程 Q学习事件驱动 Markov processLearningAlgorithm Dynamic programm

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

对广泛存在的一类事件驱动的平均费用型马尔可夫决策问题，通过分析其模型特征，研究了一种简单的增强型学习算法，不必将事件扩充为系统状态，而只对原始状态的值函数进行学习，减少了计算量和数据存储量。将算法应用于M/M/1排队系统的接纳控制问题，计算机仿真结果表明，算法优于通常的增强型学习和动态规划方法，验证了算法的有效性。

其他文献

滇东北巧家松林铅锌矿矿产资源经济效益评价

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

会议

矿床地质资源储量矿床经济概略评价松林铅锌矿

品质为先成就未来——JLG（捷尔杰）携两款新星产品亮相第四届国际高空作业平台租赁峰会

5月26日全球知名高空作业平台及伸缩臂叉装车制造商JLG（捷尔杰）应邀出席了主题为“全球视野、创新思维、理性超越、引领未来”的2017第四届国际高空作业平台租赁峰会.峰会邀请

期刊

高空作业平台租赁国际产品品质伸缩臂叉装车创新思维制造商

高校图书馆读者荐购与读者决策采购的比较研究

高校图书馆在购买图书时经常会征求读者的建议,读者荐购与读者决策采购成了高校图书采购的重要方式,同时也是提高高校图书馆馆藏文献资源建设质量的有效采访模式。文章对此做

期刊