两轮机器人自平衡稳定性控制仿真研究

来源 :计算机仿真 | 被引量 : 0次 | 上传用户:zero_alan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
两轮机器人自平衡控制的难点在于提高机器人达到平衡的快速性和稳定性的能力。为解决传统强化学习算法收敛速度慢,系统易发散的问题,提出一种分层强化学习算法。将目标任务分解为若干个子任务,为每个子任务寻找最优策略,当所有的子目标都收敛到最优值时,目标任务也收敛到最优。在上述算法中,报酬函数可以从启发式的环境中学习,加快对未知环境的探索,快速达到自平衡并保持稳定。对两轮机器人进行自平衡仿真实验。仿真结果表明,相对于传统的强化学习算法,应用改进算法的两轮机器人的各控制状态的收敛特性及机器人的学习性能更强,有效的提高了
其他文献
基于某型飞机维修费用的历史数据,运用灰色系统理论建立了GM(1,1)模型,对该装备维修保障费用进行了预测,并对模型精确度进行了验证。结果表明,所建立的模型准确、有效,可以用来对未来
施工企业的财务风险贯穿与企业经营活动的全过程,增强风险意识,找出影响施工项目财务风险因素,制定相应的防范措施,强化内部管理,避免或降低企业财务风险。
结合陕西小保当一号矿井的实际情况,对设计院《矿井可行性研究报告》中提出的井巷工程进度进行优化,提出更加合理的施工进度安排,从而有效缩短施工工期,在一定程度上保证矿井早日
采取补骨填髓养血法自拟基本方(党参、炙黄芪、当归、补骨脂、仙灵脾、鹿角胶、阿胶珠、陈皮、制大黄、六月雪)治疗肾性贫血21例,总有效率76.2%。提示本法具有改善肾性贫血减轻尿毒症,改
根据区域非均衡增长的理论内容可以总结出某一区域经济带形成的基本规律。目前我国已经形成了具有一定规模的经济带,其中辽宁沿海经济带的状况与图们江区域沿边经济带相类似。
基于阶梯形分布的上弦杆轴力假定,考虑斜腹杆的抗弯刚度和横梁高度对上弦杆侧向弹性支撑的影响作用,采用能量法推导了上弦杆的平面外屈曲临界力计算公式,并以一座半开式桁架
严格说起来,任何国家的任何媒体从来都是不会拒绝娱乐报道的.因为从媒体的方面看,娱乐新闻历来都是报道领域的富矿,所以没有任何媒体舍得丢弃这个新闻富矿.更何况,面向百姓和
由于美迪科(上海)包装材料有限公司生产我国医疗机构所需的各种专业医疗级产品和生产材料,长期来得到的好评,经专家们及应用企业的推荐,中国卫生监督协会消毒与感染控制专业
肾性贫血是慢性肾功能不全的常见并发证,且贫血程度往往与肾功能损伤程度相一致,贫血又加快了肾功能不全的进展。笔者从调理脾肾入手,运用健脾和胃益肾法治疗,取得了良好的效果。