基于变尺度编码CMAC的增强学习控制器及其应用

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:furong99bb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究了一种基于变尺度编码CMAC神经网络的增强学习控制器设计方法,并应用于以自行车平衡为模型的非线性随机系统的学习控制中.该方法通过对Markov决策过程状态空间的变尺度重叠量化编码,实现基于CMAC的多分辨率值函数逼近,从而有效地提高了增强学习控制器对连续状态空间马氏决策问题的泛化性能.针对自行车学习控制的仿真研究表明,采用变尺度编码CMAC进行值函数逼近的增强学习控制器能够获得优于已有表格型方法和均匀编码CMAC方法的学习效率和泛化性能. A design method of CMAC neural network based on enhanced learning controller is studied and applied to the learning control of a nonlinear stochastic system with a bicycle balance as a model.Through the scaling of the state space of Markov decision process Quantization coding to realize the multi-resolution value function approximation based on CMAC, which effectively enhances the generalization performance of the enhanced learning controller for Markov decision problems in continuous state space.A simulation study on bicycle learning control shows that using CMAC The enhanced learning controller which performs the approximation of the value function can obtain learning efficiency and generalization performance over the existing tabular methods and the uniform coding CMAC method.
其他文献
从训练后的神经网络中提取规则已成为当前研充热点.已有的网络规则提取方法常需网络修剪和再训练过程,因而计算成本较高.本文提出一种基于信息熵的神经网络规则提取方法.它在
快速发展的信息技术,使得电子计算机被广泛应用于水文系统中,进而产生了大量的电子文件。如今,摆在我们面前的首要任务便是加强水文基层单位的电子文件管理,使之朝着档案数字化、
北京教育学院校长研修学院副教授李雯告诉记者,许多年轻人不愿意到乡村小学任教,并不只是因为工资水平相对低下,立业、成家的困难以及文化生活匮乏等因素,都成为青年教师下乡
期刊
学校档案工作是学校整体工作的重要组成部分,学校档案管理也由过去的传统粗放型转为现在以现代化办公设备为依托的现代化精准型,并普遍采用计算机技术和网络技术,收集、整理、
期刊
一次性精密输液器是临床中为患者输液时常用的器材.以往的氯化钠、葡萄糖等液体都是瓶装的,输液时,必须插上排气管才能保证输液管道中的液体顺利静脉滴注.而现在临床中,氯化
当前我们早已经进入到了信息时代,并且由于互联网技术的快速发展,使得传统的图书馆不仅是在资源上还是在服务模式上都出现了很大的转变,这种模式的转变也是为了更好地满足时代的
医院档案,包含医院整体工作内容,所以通过这些数据资料快速得到医院的相关状况。然而目前由于档案管理的缺乏,人们对档案管理的认识还存在一定的缺陷,这也直接导致很多医院当前依
开放巨型智能系统是一类特殊的复杂系统,我们相信基于Agent的计算是目前最适合处理这类系统复杂性的途径.然而,主流的面向Agent的抽象机制不足以处理这类系统的社会性.为此,
目的探讨对重症加强护理病房(ICU)危重患者采用系统护理干预对其生存状况及心理状态的影响。方法 80例ICU危重患者,按照护理模式划分为对照组和观察组,各40例。对照组采用常
文档档案对于各行业及时代发展都具有非常重要的作用。由于文书档案更具真实性和客观性,这也使其凭证和参与作用更为突出,在当前各行业工作中,数据急剧扩张的新形势下,文书档案管