分层式强化学习的定性空间表达

来源 :中国自动化学会系统仿真专业委员会中国系统仿真学会仿真计算机与软件专业委员会2004学术年会 | 被引量 : 0次 | 上传用户:rogy520111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  分层式强化学习是解决强化学习问题中大规模学习空间问题的一种重要方法.但分层式强化学习要协调解决不同层次的学习问题,合适的问题表示方法是其关键性技术.本文以移动机器人导航控制为应用背景,在给出了基于拓扑地图的定性空间构造方法的基础上,提出了用基于定性空间推理的混合代数理论结构来描述分层式强化学习的基本框架,给出了相应的定义、定理及证明,并讨论了相关问题.
其他文献
一项刊登在国际著名医学杂志Nature Medicine上的研究报告中,来自玛嘉烈公主癌症中心的研究人员通过研究开发了一种新型方法,可以通过使得诱发干细胞更新再生的基因失活来治
对广东某地发生的一起废弃化学品管理不善导致的不明气体引发的急性中毒事件进行调查.事件造成3名人员轻度中毒,1名患者心跳呼吸骤停.企业废弃化学品管理混乱,员工缺乏职业防
  本文给出了一个基于HLA的三维视景仿真系统设计与实现的方法,具体描述了系统设计要求、体系结构、以及与其它仿真系统的HLA接口.
  汹涌澎湃的世界新军事变革大潮正以磅礴豪迈之势席卷、荡涤着世界各国政治、经济、军事、社会、生产、生活等各个领域,世界各国信息化的军事理论、信息化的武器装备、信
会议
  本文利用仿真结果作为验前信息,适当规模的现场试验结果作为子样,采用合理的Bayes统计决策方法从理论上解决了远程多管火箭炮武器系统的射击精度鉴定问题,为这项工作能既
  高层体系结构(HLA)是分布式交互仿真(DIS)的最新发展,主要目的是解决各种仿真应用之间的互操作和仿真部件的重用问题.实时分布式交互仿真是DIS的一个重要分支,但是HLA体
会议
  鉴于计算机图形图像在信息表达方面所具有的不可比拟的优点,根据实现水下三维空间声能量分布可视化的需要,本文从构建声线管束空间结构出发,利用Harpo模型解算三维空间声
会议
通过现场职业卫生调查确定AP1000核燃料元件生产线各工序辐射源项、职业人员接触情况、采取的辐射防护设施及措施,通过现场检测和个人剂量估算评估辐射防护措施的有效性,得出
从诞生到繁荣,曾经火暴异常的团购行业进入了惨烈的竞争淘汰期。面对逐渐被摊薄的市场,各大团购网站如何突破困境,安全“过冬”?    自2010年2月国内出现第一家团购网站以来,团购网站如雨后春笋一般,呈现出飞速发展的态势。《2011年(上)中国电子商务市场数据监测报告》数据显示,截止到2011年6月底,国内团购网站数量已上升到5300家。然而经过爆发式的发展,目前团购网站逐渐进入到了优胜劣汰、胜者为
文章提出了一种实用的热网监控系统软件设计方案 ,将其用于沈阳热电厂热网潮流分布时微机监控系统中 ,取得了良好的效果。 This paper presents a practical software desig