基于深度强化学习的机械臂避障路径规划研究

来源 :制造业自动化 | 被引量 : 0次 | 上传用户:vovo10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对在有静态障碍物环境下采用传统路径规划算法进行机械臂避障规划时,存在规划效率低的问题,提出一种基于深度强化学习的机械臂运动规划方法。首先,在分析机械臂数学模型和运动环境的基础上,使用Python构建机械臂仿真试验环境,并根据所建环境设置奖励函数、动作变量和状态变量;其次,针对机械臂运动中对于静态障碍物的规避问题,采用深度确定性策略梯度(DDPG)算法,并在单一障碍物与多个障碍物环境下进行仿真试验;最后,仿真试验结果表明,相较于快速搜索随机树(RRT)算法,提出的DDPG算法不仅将规划时间提高了95.0%,而且具有更高运动规划成功率。
其他文献
众所周知,爱因斯坦的广义相对论获得了巨大的成功。随着实验的进步,尤其宇宙微波背景辐射和暗物质、暗能量的理论和实验的发展,原有的宇宙学模型也暴露出与实验观测的差距。很多论文提出了各种对于原爱因斯坦场方程的修正,其中之一就是Lovelock修正。本硕士论文主要研究Lovelock修正理论中的相关问题。 本学位论文研究有关Lovelock修正的类Lifshitz解。所谓Horava-Lifshi
学位
交通问题是社会广泛关注的重大问题.近几十年来,为了探讨交通现象的内在机理,人们从不同的角度对交通流的特性进行了分析,建立了许多交通流模型.本文的工作旨在耦合映射跟驰模型的基础上,考虑智能交通运输系统的效能,提出一种改进的交通拥堵控制方案,另外,在格子流体力学模型的基础上,对几类格子流体力学模型进行理论分析和数值模拟,侧重研究非线性密度波. 本文的主要内容如下: 一、耦合映射跟驰模型
学位
采用固相反应法制备了(1-x)Bi0.47Na0.47Ba0.06TiO3-xKNbO3(BNBT-xKN, x=0~0.08)陶瓷,借助铁电分析仪,阻抗分析仪,扫描电镜(SEM)等仪器研究了KNbO3(KN)引入后对陶瓷的微观结构,相变行为和介电性能的影响。BNBT-xKN的扫描电镜(SEM)图显示:适量的KN对BNBT陶瓷具有细化晶粒,增大致密度的作用。介电温谱(30~500℃)显示BNBT,
学位
自然界中物质存在的形态有三种:固体,液体和气体,气体和液体统称为流体。对于固体和气体,我们的研究方法相对比较完善了,而对于液体的研究还不是十分成熟。在1964年,Hohenberg和Kohn[1]对量子多体系统的基态证明了两个重要定理,建立了密度泛函理论,称为DFT。一年后Mermin[2]把这一理论推广到有限温度的情形,指出多体系统的自由能是密度的泛函。后来人们发现密度泛函变分法在经典流体中能够
学位
本文描述了在外静电场ε(r|→)=-(?)ν(r|→)和静磁场(B|→)(r|→)= (?)×(A|→)(r|→)存在的情况下,电子在非简并基态或者激发态的量子密度泛函理论。{v(r|→),(A|→)(r|→)}分别表示任意的标势和矢势。量子密度泛函理论中的多电子相互作用系统与虚拟的无相互作用的费米系统具有相同的基态电子密度ρ(r|→)和物理电流密度(j|→)(r|→),并且通过微分维里定理可以从
学位
虎克原子就是由被限制在弹性系数为k的谐振子势阱中,存在库伦作用的两电子构成的。通过路径积分理论,我们研究了在任意含时外电场虎克原子问题。对于某些特定的可数无限集合离散的谐振子频率,我们得到了封闭的精确解。利用所求出精确的基态波函数,我们计算出了精确的含时极化率。利用线性响应我们得到了相同的结果。经过对比我们发现路径积分理论得到的虎克原子波函数与HPT给出的波函数是一致的,从而我们受到启发,能否用路
学位
在光学的研究领域,光谱学是其中的一个重要的研究方向。激光的诞生开拓光谱学中一个新的研究领域——非线性光谱学。本文主要介绍了非线性光谱学的相关知识、应用非线性光谱学的知识以及三波混合技术研究差频与和频的二维非线性激光谱。 在第一部分中系统的介绍了研究内容中涉及到的一些量子力学中的知识点。同时也介绍了在非线性光谱学中经常要涉及的两个不同的空间:希尔伯特空间和刘维尔空间。 在第二部分中推
学位
近年来,中国的工程项目建设有了较快的发展,施工企业数量也越来越多。目前来看,尽管中国施工企业取得了迅速成长,但拖欠农民工工资的现象依然存在,需要充分关注。在建筑施工公司的发展过程中,政府不仅要加大对其监督力度,同时还要真正地维护农民工群体的权益。本文将分析建设行业农民工工资支付中存在的问题,对提高我国农民工群体劳动报酬的具体对策展开讨论,希望能为妥善解决企业拖欠农民工工资问题提供一定的思路。
期刊
为保证机械臂的抓取精度,保证物体抓取的稳定性,设计基于卷积神经网络的机械臂抓取控制系统。在系统硬件部分,加设图像、位置和压力传感器,改装机械臂抓取控制器和运动驱动器,利用图像传感器设备,获取满足质量要求的机械臂抓取目标图像,为机械臂抓取控制功能提供硬件支持。软件部分利用卷积神经网络算法提取图像特征,确定机械臂抓取目标位置。结合机械臂当前位置的检测结果,规划机械臂抓取路线,预估机械臂抓取角度与抓取力
期刊
基于人机交互的虚拟机器人三维动态仿真及其计算是虚拟现实中的关键技术之一,是普适环境中的复杂任务计算重要内容。针对电力操作机器人作业环境的复杂性,以用户设计为中心,基于虚拟操作机械臂的三维模型,提出了机械臂操作的复杂任务中的运动轨迹规划及其运动仿真虚拟系统。构建了运动学方程的正解与反解两个方面对操作机械臂运动学模型,并利用Visual Studio编程工具以及Eon Studio仿真软件对以上研究结
期刊