【摘 要】
:
提出了一种包含在线采样、离线学习两个阶段的基于数据驱动的迭代自适应动态规划(ADP)算法,仅通过在线数据,解决输入约束的连续未知模型的非线性系统的H∞控制问题。通过策略
【基金项目】
:
国家自然科学基金(61773387)
论文部分内容阅读
提出了一种包含在线采样、离线学习两个阶段的基于数据驱动的迭代自适应动态规划(ADP)算法,仅通过在线数据,解决输入约束的连续未知模型的非线性系统的H∞控制问题。通过策略迭代(PI)和迭代强化学习(IRL)方法推导出无模型(HJI)方程。构建3个神经网络,在线采集系统数据结束后,利用离线学习方法,近似求解无模型HJI方程,进而得到值函数、控制策略和扰动策略,神经网络的未知参数通过最小二乘方法求解。仿真结果验证了算法的可行性。
其他文献
全球化、数字化是现代市场经济的两个重要标识,主要反应在人民消费需求的明显提升、资源分配(与商品供应)模式的持续变革、新兴市场的不断发掘和迅速饱和等方面,为市场经济体
近几年,以“二代”为词尾的“×二代”的数量不断增加,由“×二代”结构产生的词汇也成了当今的流行词汇。在该结构中的“二代”是否有类词缀化的趋势呢?根据笔者查阅大量类
背景:特发性肺纤维化(Idiopathic pulmonary fibrosis,IPF)是令临床医生棘手的常见病之一,其详细的病理机制未明,也欠缺有效的治疗手段。单核细胞趋化蛋白-1(Monocyte Chemoattracta
颗粒物质界面的非稳态性,是微观尺度下的重要研究方向,它往往直接影响宏观力学响应,宏观摩擦系数的非线性变化。在土力学和摩擦学领域有着重要的研究价值和意义。本课题的研
横向稳定杆是汽车悬架中的一种辅助弹性元件。横向稳定杆起到增加悬架刚度的作用。装有横向稳定杆的车辆行驶较稳定、舒适,且翻车几率大大降低。稳定杆的设计与校核一直是人
在当前高校音乐教学活动中,基于文化理念的传承与创新,已经成为永恒的焦点。因此,在高校音乐教育创新时,必须注重从该课程的文化内涵出发,通过选择合适的茶文化素材,从而真正
目的:探讨寒区新兵集训对女新兵月经状况的影响因素。方法:随机选取东北地区当年集训437名女新兵,采用自身对照的方法于集训前、集训中、集训结束后6个月,对其月经状况及月经
随着国家经济的发展,当前我国又迎来新一轮的大规模工程建设的高潮,越来越多的交通隧道建造在中西部山区。这些地区地形、地质条件复杂,公路和铁路隧道往往需要穿过地质不良地段,在修建隧道的过程中以及后期运营过程中就不可避免的要受到滑坡等地质灾害影响;同时在隧道建设的过程中,不可避免的要对山坡进行扰动,即使在隧道建设初期滑坡体还未完全发育形成,但是由于隧道施工过程中的施工扰动和后期雨水、地震以及运营过程中列
中国现当代文学的多数作品功利性较强,比如反映时代风云,在作品中提出政治主张,表现某一时期的风云变幻,要求文学担负起重要历史使命几乎成为现代文学的主流;文革之后的文学
近年来,正义问题与正义理论成为国内学界关注的热点论域。在此背景下,由西安财经大学张全胜副教授撰写、中国社会科学出版社出版发行的《马克思社会正义思想研究《一书,该书