基于Actor-Critic结构的受扰倒立摆平衡控制研究

来源 :信息系统工程 | 被引量 : 0次 | 上传用户:zhenhua212824
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文采用BP网络构建的Actor-Critic强化学习算法,解决了受扰单级倒立摆的平衡控制问题。控制算法包括Actor和Critic两个网络,其中Actor网络利用当前系统状态获得基于概率的输出动作,Critic网络得到当前动作对应的评价指标。所提出的强化学习方法利用倒立摆系统的输入输出采样数据进行迭代学习,不需要系统模型的信息。经过仿真实验验证,该算法能有效地平衡倒立摆系统并且具有一定的抗干扰能力。
其他文献
针对动压巷道支护难、二次维护工程量大的技术难题,本文利用地应力测试、数值模拟、理论分析结合现场实测等综合性研究方法,分析了动压巷道围岩的应力分布情况,并结合镇城底
申香粳3号//申香粳4号//冀粳13号(垦育2号)//青系98//京优6号
目的:了解湘黔边区苗族青少年皮褶厚度和体成分的发育规律和特点。方法:采用人体测量方法,测量了1896名湘黔边区苗族青少年的体质量、肱三头肌、肩胛下、髂前上棘和腓肠肌皮褶厚
人体解剖学是一门经典的形态学科,在医学课程中有不可替代的作用。解剖学实验课是解剖学教学的重要组成部分,实验课的成功与否直接影响医学生综合素质的培养。传统解剖学实验课
历史学家塔西佗在其著作中提到:“一旦皇帝成了人们憎恨的对象,他做的好事和坏事同样会引起人们对他的厌恶”。这一理论后来被学者引申成为一种社会现象,当政府部门或某一组织失去公信力时,无论说真话还是假话,做好事还是坏事,都会被认为是说假话、做坏事,这也被称作“塔西佗陷阱”。如何走出“憎恨”的陷阱,就是对“说话者”智慧的考验,应用到教学中也是一样的。如何让学生克服“信任危机”,也是对思政课教师心智和能力的
苹果春季发布会北京时间3月26日凌晨1点如约而至,但遗憾的是没有传说中IPhone SE 2的发布,带来的却是苹果电视Apple TV+原创视频内容、苹果新闻Apple News+以及苹果信用卡在
伴随着社会生产力的发展、科学技术的进步以及人类改造自然能力的增强,人类面临的全球环境问题也越来越突出,诸如气候变化、环境污染、生态退化和生物多样性破坏等等环境问题
主动脉夹层(aortic dissection,AD)是指主动脉内血流在高压作用下穿过主动脉内膜裂隙进入中膜,血液在内中膜之间形成血肿,并可沿主动脉纵轴方向继续撕开血管内中膜,导致血管形
目的:探讨细胞外调节蛋白激酶(ERK)信号转导通路在体外诱导大鼠海马神经干细胞向施万细胞分化中的作用。方法:体外培养大鼠海马神经干细胞,向培养液中添加混和诱导剂诱导神经干细
近日,日本索尼公司与日本移动通信运营商NTT DOCOMO合作,利用5G移动技术测试索尼的无人驾驶概念车CartSC-1(NewConcept CartSC-1)。此次测试将使用DOCOMO位于关岛的5G开放实