移动机器人运动规划中的深度强化学习方法

来源 :控制与决策 | 被引量 : 0次 | 上传用户:jack607
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动机器人作业环境复杂度的提高、随机性的增强、信息量的减少,移动机器人的运动规划能力受到了严峻的挑战.研究移动机器人高效自主的运动规划理论与方法,使其在长期任务中始终保持良好的复杂环境适应能力,对保障工作安全和提升任务效率具有重要意义.对此,从移动机器人运动规划典型应用出发,重点综述了更加适应于机器人动态复杂环境的运动规划方法——深度强化学习方法.分别从基于价值、基于策略和基于行动者-评论家三类强化学习运动规划方法入手,深入分析深度强化学习规划方法的特点和实际应用场景,对比了它们的优势和不足.进而对此类算法的改进和优化方向进行分类归纳,提出了目前深度强化学习运动规划方法所面临的挑战和亟待解决的问题,并展望了未来的发展方向,为机器人智能化的发展提供参考.
其他文献
本文以济南黄河公铁两用桥工程为例,系统地论述了在砂层地质条件下,采用锁扣钢管桩围堰进行基础承台施工的主要工序过程,特别强调了锁扣钢管桩围堰施工工艺流程、工艺特点、
殷平,女,汉族,1971年10月出生,江苏东台人,理学博士,教授,材料学专业硕士生导师。1989年9月至1993年7月于南京大学化学与化工学院化学专业学习,获理学学士学位;1993年9月至19
我国“十三五”规划纲要中提出建设资源节约型、环境友好型社会。为了贯彻执行节能减排的发展策略,在建筑电气设计中,要强化节能降耗设计。以沙北实验学校工程设计为例,探讨
随着互联网和电子商务的不断发展,人们对网络购物及网上支付需求的不断增加,简单易用的静态口令认证技术由于自身安全的缺陷,已经不能满足当前网络应用系统。因此,业界提出了
土壤固化剂是用于不良土壤处理的新型工程材料,由不同的有机材料、无机材料合成。掺入一定比例的土壤固化剂,可以加固不良土壤地基,达到所需要的承载能力。软土地基处理中应
教师的职业是平凡的。在平凡中耕耘,在平凡中用激情让生命怒放,是每一个有理想的教师的不懈追求。 Teacher’s occupation is trivial. In the ordinary hard work, in ordi
期刊
研究活性白土对染料废水中甲基橙的吸附,考察了接触时间、活性白土的用量、pH值以及温度对吸附作用的影响。获得白土对甲基橙吸附的相关热力学参数,表明活性白土对甲基橙吸附
项目教学法是一种新兴的教学方法。Photoshop软件是电脑美术专业学生的软件基础课,是学生做好平面设计的一个很好的工具。而项目教学法起源于美国,盛行于德国,尤其适合于职业
通过对低热水泥熟料岩相结构观察,分析了低热水泥熟料岩相结构特征;介绍了低热水泥的配料率值,即低KH、p值和高n值;分析了熟料煅烧环节参数的调整,需要减少喂料量,减少分解炉
多机械臂的精准协同控制已成为当前机器人领域的研究难点,为实现双机械臂精准控制,通过建立双机械臂动力学模型,采用时间延时估计简化机械臂动力学模型,在保证控制系统稳定性