【摘 要】
:
针对现有空间机械臂控制方法在实际应用中调试时间长、稳定性差的问题,提出一种基于深度强化学习的控制算法.构建仿真环境用于产生数据,通过状态变量实现仿真环境与深度强化
【机 构】
:
北京电子工程总体研究所,北京100854;北京仿真中心,北京100854
论文部分内容阅读
针对现有空间机械臂控制方法在实际应用中调试时间长、稳定性差的问题,提出一种基于深度强化学习的控制算法.构建仿真环境用于产生数据,通过状态变量实现仿真环境与深度强化学习算法的交互,通过奖励函数实现对神经网络参数的训练,最终实现使用近端策略优化算法(Proximal Policy Optimization,PPO)控制空间机械臂将抓手移动至物体下方特定位置的目的 .实验结果表明,本文提出的控制算法能够快速收敛,实现控制空间机械臂完成特定目标,并且有效降低抖动现象,提升控制的稳定性.
其他文献
针对GNSS/SINS组合导航系统在全球导航卫星系统(GNSS)失效情况下,系统导航误差会因捷联式惯性导航系统(SINS)的误差积累而迅速扩大的问题,提出一种基于卡尔曼滤波(KF)的GNSS/
LOFT原指工厂或仓库的上层楼顶,如今逐渐演变为由废弃厂房改造而成的灵活可变的大型居住空间.本文从LOFT文化的起源、空间形态以及LOFT盛行的原因方面入手,简要介绍LOFT居住
Wilkins在Linguistics in Language Teaching一书中指出:Without grammar very little can be conveyed, without vocabulary nothing can be conveyed.由此我们可知,词汇在我们个人的语言能力发展中起着重要的作用。 1. 目前高中学生学习英语词汇中存在的问题 (1) 在平时英语词汇
文章结合参加2011年台达杯竞赛作品的设计构思,探讨"伯格曼法则"对低碳住宅的设计立意的启发性,以此为作品立意构思的原点,在三个环节探讨住宅单体建筑的"低碳"设计策略.通过
针对某型火箭外测系统设备故障现象,在对服务器A启动缓慢故障原因分析的基础上,建立了层次故障树模型,开展了定性分析和针对性故障验证试验,确定了该故障发生的原因,并采取了
本文回顾了龙庆忠教授的坎坷人生和执教的业绩,重温了龙老的注重继承并发扬中国传统建筑文化、把建筑研究纳入天、地、人宇宙大系统中、重视建筑防灾研究,创立中国建筑防灾学
抽水蓄能电站工程造价控制贯穿工程建设全过程,而设计阶段及对设计单位的管理是造价控制的关键点。结合抽水蓄能电站工程的特点和难点以及电站建设中的实际情况,在造价控制总体
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view profile.
俗话说,一年之计在于春,你是否也为自己春天的饮食做好计划了呢?以下4种蔬菜有利于春天保健养生,应该多吃。 豆芽防口干唇燥症状 春天气候干燥,容易出现口干唇燥等口角炎症状,而豆芽味道鲜美,是滋养润燥、清热解毒的好选择。无论是黄豆芽还是绿豆芽,跟原豆相比,它们的维生素含量增加,矿物质利用率提高,并且蛋白质和多糖更易吸收。从中医的角度来说,开春吃豆芽,能帮助五脏从冬藏转向春生,有利于肝气疏通、健脾、
通过分析新兴地方建筑院校目前存在的困难,结合实例提出必须合理定位、扬长避短,整合师资力量、打造教学科研团队;通过树立精品工程、激发本科生的创新能力等方式摸索出适合