基于深度强化学习的六足机器人运动规划

来源 :智能科学与技术学报 | 被引量 : 0次 | 上传用户:Superumts
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
六足机器人拥有多个冗余自由度,适用于复杂的非结构环境。离散环境作为非结构环境的一个苛刻特例,需要六足机器人具备更加高效可靠的运动策略。以平面随机梅花桩为例,设定随机起始点与目标区域,利用深度强化学习算法进行训练,并得到六足机器人在平面梅花桩环境中的运动策略。为了加快训练进程,采用具有优先经验重放机制的深度确定性策略梯度算法。最后在真实环境中进行验证,实验结果表明,所规划的运动策略能让六足机器人在平面梅花桩环境中高效平稳地从起始点运动到目标区域。为六足机器人在真实离散环境中的精确运动规划奠定了基础。
其他文献
3月28日,从青岛开往北京南的D54次和谐号列车,在山东境内潍坊附近发生事故,列车车头部裂开大口子,一名男子被撞身亡。
目前,瞪羚企业数量已经成为衡量一个地区创新活力的标志,对区域经济发展的促进作用日益提高,瞪羚企业的区位选择在促进一个区域或一个城市经济空间的塑造上发挥着举足轻重的
巨大的市场及发展潜力,吸引了大量的投资者,据有关资料显示,我国注册的专门从事物流的企业已达数十万家之多。与此同时,我国加入WTO,承诺3年后将全面开放国内物流市场,国际物流企业
提出一种新的冠状动脉血管二维运动分析方法,采用活动轮廓(snake)模型技术。对X射线冠状动脉造影图像序列中的血管段进行运动跟踪。把前一帧中snake的停留位置作为当前帧snake的
最近,我们按照总行统计司和西安分行的安排,就我省房地产企业占压资金情况在全省范围内开展了调查,并在房地产企业相对集中、资金占压较多的兰州市选择了8家房地产企业进行了
以额济纳绿洲胡杨(Populus euphratica Oliv)为研究对象,用美国Li-cor公司生产的Li-6400便携式光合作用测定仪测定其光合速率的日变化及控制光强、CO2浓度和温度等环境因子,阐述了光合速率对光强和CO2浓度的响应特征。结果表明:在生长季胡杨阳叶光合速率的日变化呈现双峰曲线,具有明显的光合“午休”现象,但胡杨阴叶光合速率的日变化呈单峰曲线。光照、温度和CO2浓度皆对胡杨的
中国三大航空集团自10月11日重组以来,在各界引起了强烈反响。从目前中国民航所面临的内忧外患情形来看,经济学家和行业人士都认为此次大的举措是中国民航改革的一个必然趋势。
人的素质总是与一定社会的生产水平、科学技术以及精神文明程度密切相关。而担负起素质教学的教师更是对今天的受教育者——21世纪的建设者的素质的影响至关重大,因此素质教育的