切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
基于状态集结的值函数逼近
基于状态集结的值函数逼近
来源 :北京理工大学学报 | 被引量 : 0次 | 上传用户:strongit_likai
【摘 要】
:
用更为紧凑的方法表示和存贮值函数,以求解大规模平均模型Markov决策规划(MDP)问题。通过状态集结相对值迭代算法逼近值函数,用Span半范数和压缩映原理分析算法的收敛性。给出了状态集结后的Bellman最
【作 者】
:
胡光华
刘英敏
【机 构】
:
北京理工大学自动控制系
【出 处】
:
北京理工大学学报
【发表日期】
:
2000年3期
【关键词】
:
动态规划
状态集结
随机控制
值函数逼近
dynamic programming Markov decision processes compact repre
【基金项目】
:
国家自然科学基金资助项目! (6 96 740 0 5 )
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用更为紧凑的方法表示和存贮值函数,以求解大规模平均模型Markov决策规划(MDP)问题。通过状态集结相对值迭代算法逼近值函数,用Span半范数和压缩映原理分析算法的收敛性。给出了状态集结后的Bellman最优方程。在Span压缩条件下了该算法的收敛性,同时还给出了其误差估计。
其他文献
产能置换明确细则
在国家多个环保政策的推动下,水泥行业通过强自律、控新增、推整合、严错峰等方式压减过剩无效产能,水泥市场总体供需矛盾得到了明显改善,促进行业效益大幅好转,但在高盈利的
期刊
产能
置换
环保政策
水泥行业
供需矛盾
水泥市场
盈利
非完整系统在非高斯脉冲式噪声下的随机响应
目的 研究非完整系统在非高斯脉冲噪声扰动下的随机响应。方法 本论文提供了一种非完整力学系统在Poisson分布脉冲(PDP过程)扰动下统计矩响应的计算方法,该方法的基本出发点是将传统的Ito随
期刊
分析力学
非完整系统
非高斯噪声
随机响应
无机化学教学的实践与探索
无机化学作为化学专业的一门基础课,在该专业课程中有着非常重要的作用。在教学中,为了有效地提高教学质量,必须从教学内容、教学方法、教师科研水平等方面进行全方位改革。
期刊
无机化学
教学改革
探索
inorganic chemistry teaching reform probe
我校8种教材入选“精品教材”建设立项
期刊
水泥产能置换应慎之又慎
工信部关于《水泥玻璃行业产能置换实施办法》(工信部原[2017]337号)于2017年12月31日出台以来,存水泥行业引起了巨大反响,不足半年时间,以各种形式的产能置换在建或拟建生产线已
期刊
水泥行业
产能
置换
玻璃行业
生产线
数据可视化在pdm系统中的研究与应用
Creo View数据可视化主要指的是通过图形或者图像处理,还有计算机视觉技术去表示、建模和对立体以及显示动画,进而达到对数据可视化的理解及运用,它是大数据时代的关键应用,
期刊
数据可视化
PDM系统
应用研究
农民动迁后的生活行为变化及评价
通过对苏州某农民动迁小区的16位居民及其家庭进行访谈和问卷调查,研究中国快速城市化背景下的居民生活环境转换的过程和特征,分析环境转换中居民生活行为的变化,把握居民环
期刊
动迁小区
农村居民
环境转换
生活行为
评价
MH/Ni电池电极材料在过充电条件下的失效分析
采用SEM,XRD,TEM以及EIS等检测方法,研究不同过充循环前后MH/Ni电池性能与正负极材料形貌及表面元素的变化.实验结果表明,经正常充放电循环70周后,正极活性物质表面保持良好
期刊
MH/NI电池
电极材料
过充电
失效分析
MH/Ni batteries electrodes materials overcharge degradatio
信息捕捉器的智能机制
目的研究与讨论万维网信息捕捉智能机制。方法采用算法模型建立捕捉 器概念模式,并采用知识推理及文本聚类技术对捕捉结果进行规则分类。结果设计了基于知识体系的智能机制框
期刊
智能机制
自适应机制
信息捕捉器
万维网
network information captureintelligent mechanismsselfadapti
模糊带色成色剂
期刊
成色剂
感光材料
与本文相关的学术论文