一种自适应强化学习算法在状态空间构建中的应用

来源 :系统仿真学报 | 被引量 : 7次 | 上传用户:sztsb99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对模型未知以及具有连续状态的系统控制问题,提出一种基于强化学习的自适应控制策略。在Actor-Critic框架下,建立归一化径向基网络的自适应调节机制,实现未知系统状态空间的动态创建。有效克服了状态空间分割所带来的维度灾难,而且能够使得系统的结构总保持在最佳状态。通过对倒立摆控制的仿真研究验证了方法的有效性。
其他文献
针对持续发展的高性能计算带来的新需求,我们设计与实现了DCJM机群作业管理系统,并使用了多种高可用保障措施。为了验证其有效性,综合使用可靠性框图、故障树和随机Petri网等工具对DCJM建模,然后基于实际测量的参数,使用统一的模型求解,对系统可用性进行了完整的评价。分析结果显示DCJM系统达到了高可用性。
喜、怒、忧、思、悲、恐、惊这七种正常的精神刺激反应简称七情。七情理论是祖国医学理论体系的重要组成部分,它既包含古代的哲学思想,又具有现代人文科学的意识。《内经·素问》提出:“喜伤心”、“怒伤肝”、“思伤脾”、“忧伤肺”,其意进一步说明不同的情志所伤也易病及相关的脏腑。
在高师钢琴教学中,不但要使演奏者理解所演奏的乐曲、掌握演奏所需要的技巧,还要理解演奏乐曲的风格以及创作时的历史背景。同时,应合理安排教学内容,注重心理因素的调动及舞
据最新的统计显示,中国的糖尿病发病率高达9.7%,全国糖尿病人接近一个亿,中国已成为全球范围糖尿病增长最快的地区。因缺乏系统糖尿病教育所导致的"无知的代价"给患者、家庭和
妇女从怀孕到分娩要经过一个漫长的生理及心理变化,往往给产妇带来重大的应激反应,尤其是初产妇更容易出现一些复杂的心理变化。
受精卵在子宫体腔以外着床,称异位妊娠,习子宫外孕。其中输卵管妊娠最为常见,占异位妊娠的95%左右,进年来输卵管妊娠的发病率明显上升。输卵管妊娠流产或破裂时,可引起严重腹腔内出
提出了一种基于分流模型PID与鲁棒补偿的复合控制策略,这种控制器具有非线性滤波、增益自调整、鲁棒性好等优良特性。由于分流模型的输出是稳定、光滑且有界,可以构造一类具有输出光滑、有界并且增益自调整的PID控制器,其可设计一类安全控制系统。将分流模型PID与鲁棒补偿控制相结合,有效地解决了参数不确定情况下的一类非线性系统的鲁棒控制问题。通过倒立摆控制系统的仿真研究,验证了控制策略的有效性。
社区门诊护理是与人们健康需求相适应的健康服务模式,将公民的健康教育、预防、护理、康复和保健有机的结合,以健康教育、健康咨询和指导等服务方式,为公民提供便捷的医疗服务。社区门诊护理是实现“人人享有卫生保健”的基础环节,它及时、便捷、经济、优质的健康服务是人们所期盼的,是我国医疗卫生事业的发展趋势。现就我国社区门诊护理的现存问题和解决对策论述如下。
目的对于护理干预在妊娠合并糖尿病肝病患者中的应用进行研究探讨。方法选取2013年12月—2014年12月期间在该院接受治疗的妊娠合并糖尿病肝病患者100例,将其随机分为对照组和
目的探讨综合护理在护理小面积糖尿病足部溃疡患者中的应用效果,并进行分析,以供参考。方法选取2013年4月—2014年4月在该院收治的小面积糖尿病足部溃疡患者共116例,以此作为