基于深度强化学习的机械臂控制方法

来源 :系统仿真学报 | 被引量 : 0次 | 上传用户:suals
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度强化学习在环境中不断探索尝试,通过奖励函数对神经网络参数进行调节。实际的生产线无法作为算法的试错环境,不能提供足够的数据,构建一个机械臂仿真环境,包括机械臂与物体两部分,根据目标设置状态变量与奖励机制,在模型中对深度确定性策略梯度算法(Deep Deterministic Policy Gradient, DDPG)进行训练,实现通过深度强化学习算法控制机械臂,将抓手移动至物体下方,改进控制算法的适应性,缩短调试时间。实验结果表明,深度学习算法能够在更短的时间内达到收敛,实现对机械臂的控制。
其他文献
顺风车乘客遇害事件让网约车的安全问题再度被推到风口浪尖,嫌疑人违规借用其父亲的账号接单,暴露出网约车长期存在的“马甲车”等安全隐患。前一段时间,因为新互联网企业的加入
报纸
生态翻译学中的"三维转换"分别是指语言维、文化维和交际维的适应性选择转换。它不仅能为文学翻译提供良好的理论指导,还能实现交际意图的传递和文化内涵的传载。本文以《钦差
环境中有毒有害污染物的种类和数量日益增多,给生态环境和人体健康造成了巨大威胁,如何评价其对生物的影响越来越受到人们的关注。本文通过查阅国内外大量文献,对有毒有害污
该文以2012-2017年CSSCI源刊(含扩展版)所发表的365篇翻转课堂研究文献为研究对象进行统计分析,采用定性、定量相结合的研究方法,从翻转课堂的由来、总体趋势、研究的热点三
目前所有油料饼粕类氢氧化钾蛋白质溶解度的测定方法均参考GB/T 19541-2004饲料用大豆粕,本文通过对饲料企业常用三种饼粕类样品的实验分析,得出温度变化对氢氧化钾蛋白质溶
<正>仔猪断奶后从吮吸口感好、易消化的液体母乳突然转到采食以复杂碳水化合物和植物蛋白为基础的干料,应激十分强烈(Miller等1984),生长受阻。仔猪在断奶后前7天或前10天的
目的观察火针联合LED红蓝光照射治疗痤疮的疗效。方法 60例患者,随机分为采用火针联合LED红蓝光治疗的观察组和采用单纯LED红蓝光治疗的对照组,其中两组均对痤疮区域进行红蓝
“性宗圆教”是延寿“禅教一致”思想的核心,其根本含义是“无相真心不变随缘,与一切法不一不异”,该思想以融通性、空、相三宗为特点,其主旨是“以心为宗”,而其依据的主要
<正> 心肌梗塞是冠状动脉闭塞,使部份心肌因严重缺血而发生局部坏死,临床上常有胸骨后剧烈疼痛、发热、心律失常等严重病证。在心肌梗塞急性期,心律失常极为常见,在起病3天内
期刊
<正>芍药甘草汤出自《伤寒论》,是医圣张仲景为外感病误用汗法造成脚挛急一证而设。方以芍药、甘草相配柔肝和脾,滋阴养血,实有酸甘化阴之妙,可起缓急止痛之效。张喜奎老师临
会议