【摘 要】
:
在大规模随机控制问题中,值函数逼近是一种克服维数灾的方法.考虑平均模型马氏决策规划(MDP)的状态软集结相对值迭代算法,在Span压缩的条件下,证明了该算法的收敛性,同时还给
【机 构】
:
北京理工大学自动控制系北京,达特茅斯学院工学院
论文部分内容阅读
在大规模随机控制问题中,值函数逼近是一种克服维数灾的方法.考虑平均模型马氏决策规划(MDP)的状态软集结相对值迭代算法,在Span压缩的条件下,证明了该算法的收敛性,同时还给出了其误差估计.
其他文献
研究了单程形状记忆合金(SMA)驱动器的工作机理,基于热力学基本定律建立了单程SMA驱动器的功/能和热/能转换模型,分析了SMA元件的性能对单程SMA驱动器输出性能的影响,提出了
非线性系统的观测器设计无论在理论上还是在实际应用中 ,一直都是控制界研究的重要课题之一。针对一类非线性系统 ,论文用前馈神经网络的函数逼近能力 ,提出了基于神经网络的观测器设计方法 ,建立了 L yapunov函数 ,并给出了网络权系数矩阵的在线学习规则为δ-修正。证明了网络权矩阵是最终一致有界的。最后针对单臂机器手实例 ,给出了仿真实验。
在简单盐溶液中添加络合剂--柠檬酸,电共沉积AlxGa1-xAs三元化合物.用能谱分析仪进行成分分析,获得化学计量比接近Al0.3Ga0.7As的三元化合物半导体材料.
针对 EPS发泡模型对真空消失模铸造工艺生产球墨铸铁管件质量和生产效率的影响 ,分析了 T型管件承插口的结构特征 ,研制了 T型承口一次整体发泡成形模具 ,并详细介绍了旋转抽
基于大量的开采资料及煤田地质、水文地质、矿山压力等资料,结合地质力学观点,对肥城煤田深部开采突水的可能性作了系统性的评价.认为肥城煤田深部开采突水概率将极大地降低,
提出了一种将计算全息和全息干涉相结合的防伪方法.这种方法设计灵活,防伪功能强,摄制的全息图可由白光再现检测,具有很高的实用价值.还讨论了这种白光再现的原理.
目的:将校外药学博士(EPD)计划的概念引人国内,为我国的药师职能转变工作提供一定的借鉴和参考.方法:查阅有关EPD计划的文献资料并访问相关网站.结果:通过EPD的学习,很多在职
基于 ICMMS思想设计了新型抽水蓄能调速器 ,其故障诊断单元可进行故障的类别确定、定位、趋势分析。不仅使调速器本身运行可靠 ,而且还向预知维护子系统实时地提供状态、态势
在环型扩压叶栅实验风洞上进行了弯曲叶栅出口测量实验 ,研究了零冲角附近下常规直叶栅、正倾斜叶栅、正弯曲叶栅、S型叶栅对出口总压损失分布情况和二次流速度矢量的影响并
提出了一种基于空时DFT投影的宽带信号二维角估计算法 .该方法采用 3个共面的均匀线阵 ,每一均匀线阵对宽带信号空间采样 ,然后进行空时二维DFT变换 ,在空时频率域对宽带信号