基于改进ADHDP算法的倒立摆学习控制

来源 :周口师范学院学报 | 被引量 : 0次 | 上传用户:lianxirenll520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对动态规划中的“模型灾”和“维数灾”问题,提出了不需要数学模型和最优控制的执行依赖启发式动态规划(Action-dependent Heuristic Dynamic Programming,ADHDP),而ADHDP执行网络和评价网络采用基于监督学习的误差反向传播(BP)算法,但BP算法收敛速度较慢.在此基础上建立了以径向基神经网络(RBFNN)为执行网络和评价网络,并以梯度下降算法为网络的在线学习算法,对ADHDP的控制算法进行改进.通过用倒立摆学习控制模型进行仿真,验证了改进的ADHDP算法具有良
其他文献
针对市场上出现的拼衣现象,全面分析了其特点和发展状况.列举实例,提出了三种最优的拼衣方案,通过建立数学模型,详细给出了不同拼衣方案下,消费金额的划分方法以及不同方法之间的
很久以前,欧洲西部的原始森林被沼泽地覆盖了,没有城市,也没有人烟。直到一千年前,有一只松鼠跑来,爬到树上,看到被原始森林和沼泽地覆盖的地方,地势低洼,湖泊众多,是一个“低地之国”
桩基持力层的选择和合理利用事关工程结构的安全、可靠、经济。本文针对上海部分地区存在较厚的 5 - 2层土的特点 ,通过对土的物理力学性质分析研究 ,提出了充分合理利用 5 -
以2016年全国大学生数学建模竞赛C题“电池剩余放电时间预测”为例,通过对给出的铅酸电池采样数据进行分析,得到了各电流强度下的放电曲线,并建立了20A到100A之间任一恒定电流强
【摘 要】高新技术的发展带动了高新技术企业的崛起,近年来,我国经济发展速度快速提升,其中一个很重要的增长点就是高新技术企业的发展对经济的推动。同很多企业一样,高新技术企业同样具有缴税纳税的义务,但因其在经济发展中的特殊作用,对于已经审核认定的高新技术企业,国家有一定的纳税优惠政策。高新技术企业如何防范税务管理带给自身的风险,以及如何合理利用国家相关优惠政策,是每个高新技术企业都应当注重的问题。本文
黑龙江省是中俄经济合作的重要承担区和受惠区,通过对人力资本模型加以修改,构造适当的计量经济模型对黑龙江省参与中俄经济合作的长期增长效应进行分析,发现黑俄经济合作对黑龙
搜集了影响学生期末综合成绩的10门课程成绩,借助SPSS软件,通过因子分析法,提取出公共因子即实践分析能力和理论掌握程度,再计算因子得分、综合得分和综合排名,以此作为掌握学生潜
11月14日,以“炫彩黄水红漫干野”为主题的2015重庆黄水千野草场火棘旅游季在黄水旅游区启动,当天所有游客免收门票。黄水干野草场火棘旅游季在一片浓烈的秋色里正式拉开了帷幕