马氏决策过程的递阶强化学习与灵敏度分析

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:sust_alex
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习集成了人工智能与最优控制的基本思想,为求解大规模随机决策、优化和控制问题提供了一种有效方法,正逐渐引起人工智能、自动控制、运筹学、经济管理等各领域的研究兴趣.在现有马氏决策和强化学习理论已有成果的基础上,该文研究了平均马氏决策问题的递阶强化学习;在半马氏过程灵敏度分析的基础上,研究了半马氏决策过程的表现-评判(Actor-Critic)算法,并对可重入排队网络的灵敏度分析问题进行了研究.
其他文献
该文作者在模式识别国家重点实验室机器人视觉组攻读硕士学位期间,主要从事三维立体视觉方面的研究,具体内容包括摄像机自标定、特征点的自动匹配、三维重建等.主要工作可以
该文对网络家电的结构进行了研究和探讨,并对其信息传输媒介进行了设计.网络家电技术包括两方面:一是家电之间的互连问题;二是家电网络与外部网络的通讯问题.要实现家电之间
随着计算机的普及,仪器工业正在经历一场巨变。计算机强大的处理和显示能力,使它可以在数据采集、分析和表达中的任意一个方面提升仪器的性能。全世界不计其数的科学家和工程师
随着微电子技术的发展,嵌入式系统在家庭和工业的各个领域得到了广泛的应用,但是嵌入式系统一般是独立于Internet网以外的。在现代社会中,Internet网已经成为重要的基础信息设施
该文主要研究了概念聚类在证券金融数据挖掘中的应用.将大规模数据集合高效地划分为有意义的子集的是金融数据挖掘的基本问题之一.由于数据采集时的随意性和不规则性,加上市
印刷电路板(PCB)作为机电产品重要组成部分,对整个产品的质量水平起着举足轻重的作用.该文旨在建立一个适合中国机电行业特点,能够进行"路内"测试和功能测试,并充分利用现代
作者进行了如下几个方面的研究工作:1、在语音合成方面,作者研究比较了各种语音合成方法的特点,在汉语具体特点基础上,采用波形拼接的方法,建立了一个高自然度旅游信息语音合
该文研究一套农田节水灌溉决策监控系统,并将其运用到实际生产中,主要工作包括以下三方面:1、针对定额水量在线优化调的控制系统,研究并建立了节水灌溉优化模型.2、针对中国
该文研究了火电厂单元机组协调控制系统的模型辨识和控制器的设计问题.利用辅助变量法对仿真的协调控制系统的模型参数进行了辨识,并提出了以变结构控制理论为基础的控制器设
该文研究离散是滞不确定系统的鲁棒稳定性分析和鲁棒控制器设计问题.由于 近些年来计算机在工业现场的广泛应用,对这一问题的深入研究,不仅能完善时滞系统的理论体系,而且将