基于稀疏奖励强化学习的机械臂运动规划算法设计与实现

来源 :厦门理工学院 | 被引量 : 0次 | 上传用户:thangna9806
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了使机械臂在非结构化环境下实现端到端的自主学习控制,本文基于深度强化学习算法结合视觉图像与运动学模型完成机械臂抵达目标区域任务,针对稀疏奖励环境下机械臂运动控制算法探索效率低、学习速度慢、样本利用率低等问题,研究设计了改进方法,提高了任务成功率。本文根据任务适配选择采用深度确定性策略梯度算法,设计了预设任务的机械臂控制方法总体框架,提出了一种结合重要性采样的机械臂运动控制方法,增大了有效样本的采样概率,提高了样本的利用率。在二维仿真实验中从平均奖励、平均步数和成功率三个标准分析了改进方法的效果,验证方法的可行性和有效性。在Coppelia Sim仿真平台中搭建了三维实验环境,实现了实验场景与控制应用程序的远程通信,基于该环境研究了以双目视觉图像为输入的6自由度工业机械臂的运动控制方法。在三维实验中设计了新的网络结构和奖励函数,依据三个评判标准对比分析了模型效果,相较于原始算法,改进算法的成功率提升了16个百分点。为了进一步提高三维环境下机械臂的学习速度和学习质量,提出了一种运动学奖励驱动的机械臂控制方法。基于机械臂运动学分析,通过解析法求解关节逆解值,以最小功率作为目标引导。从稀疏奖励、距离奖励和运动学奖励三个方面改进设计了奖励函数,仿真实验结果显示,改进方法相较于原始算法成功率提升了7个百分点。最后在三维仿真环境下使用综合改进算法测试分析了随机目标模型和固定目标模型的效果,在随机场景下综合改进算法成功率提升到33.5%,在固定目标场景下成功率提升到46.5%。
其他文献
随着配电运维的发展和智能化技术的趋于成熟,越来越多的智能技术运用到配电房的运维中,协助配电运维人员完成工作。针对配电运维管理工作量多、工作难度大的问题,本文设计了一款基于语音芯片及云平台语音接口的配电房智能语音系统,采用智能语音技术,结合配电运维系统管理后台,利用云服务器调取通信管理机发送至配电运维管理平台的配电房设备数据,实现了语音查询控制配电房设备的功能。本文主要工作如下:首先,分析了系统功能
学位
人机共融是移动机器人的一大重要趋势,而行人跟随机器人正是其中一项重要的研究方向。针对视觉行人跟随机器人在老人陪伴、行李搬运和智能安防场景下的目标遮挡、目标丢失时容易丢失目标且在运动过程中容易产生抖动问题,本文开展了基于改进核相关滤波算法的跟随机器人系统研究,最终完成了跟随机器人对目标行人的抗干扰,防丢失的稳定视觉跟随任务。本文的主要研究工作如下:首先根据视觉跟随机器人的需求分析,设计了视觉跟随机器
学位
目的 :分析急性髓系白血病患者常见的几种融合基因及基因突变和临床白血病类型的相关性,讨论常见融合基因及基因突变在临床诊断和分型中的应用价值。方法:收集110例初发的急性髓系白血病患者,分别记录他们的性别、年龄、发病时外周血白细胞数,常见融合基因与基因突变的结果,结合临床诊断了解融合基因及基因突变对髓系白血病类型的关系。结果 :110例急性髓系白血病统计出融合基因及基因突变的阳性率为60.9%,包括
会议
柱上开关作为一种具有控制、保护和隔离等功能的开关设备,广泛应用于我国配电网。柱上开关通常安装于户外输电杆上,易受光照、风雪、雨水、季节更替等外部环境温度变化的影响,也易受负荷容量变化导致自身内部温度变化的影响。柱上开关的系统电压测量关键部件——电子式电压互感器(Electronic Voltage Transformer,EVT),因其运行环境温度的变化,进而使得测量精度无法达到设计要求。EVT测
学位
随着计算机技术和传感器技术的不断发展,为更好满足自动化生产设备柔性化的需求,相较于传统单一机械臂/AGV各自完成某一环节的任务,将两者集成为兼具移动和可操作功能的移动机器人极大地拓展了传统机器人的应用范围,在各领域都具备广阔的应用前景。移动机器人研究是一项复杂的系统工程,涉及视觉定位技术、SLAM(Simultaneous Localization And Mapping)与导航技术、智能控制技术
学位
核酸检测在传染性疾病的预防与诊断方面发挥着重要的作用,例如,自新型冠状病毒(SARS-CoV-2)肆虐以来,核酸检测结果已经成为发现并隔离被感染者以限制疫情的进一步扩大的重要依据之一。但由于传统核酸检测技术操作过程复杂且样本易受污染造成假阳性,使得核酸检测效率低、发放报告结果等待时间较长且无法向基层医疗单位大规模推广应用。为突破这一限制瓶颈,本人所在课题组研发设计了基于微流控的核酸现场快速检测仪器
学位
磁共振成像(Magnetic Resonance Image,MRI)是临床医疗重要的辅助诊断手段之一,它既能可视化医生感兴趣的组织和器官,又具备了其他医疗成像方式没有的优点,比如无放射性、多参数采集、成像自由度高等。为了获得更丰富的细节,医生往往会通过改变仪器参数来获取多个对比度的图像。由于不同对比度图像不是同时采集的,增加采集对比度的数量将会直接导致采集时间的增加。因此,加速磁共振图像的采集以
学位
《晚熟的人》有12篇中短篇小说,体现了莫言的文学主张,即暴露黑暗,揭示邪恶,文学永远不是唱赞歌的工具。但是,莫言作为生长在新中国、由党和人民培养出来的体制内的党员作家,应该有歌颂真善美,引导社会向上向善的责任和担当。
期刊
随着真空断路器在电气领域的快速发展,真空断路器弹簧操动机构作为一种开关设备在中压领域中得到广泛应用,真空断路器中弹簧操动机构性能的优劣对电力系统可靠性有重要影响。对弹簧操动机构进行理论研究、优化设计、样机试验对提升整机运行参数具有重要意义。本文以断路器弹簧操动机构为研究对象,采用理论分析、动力学仿真、算法优化以及样机试验相结合的方法,对操动机构中的四连杆机构进行优化与设计,改善断路器在合闸过程剩余
学位
《晚熟的人》是莫言在获得诺贝尔文学奖之后出版的首部中短篇小说集,体现出作家试图突破“诺奖魔咒”的努力,可以看作是其“晚期风格”的开始。与之前的作品相比,莫言在这部小说集中的叙述视角从在场者的故事讲述转变为还乡者的冷静审视,叙述风格从汪洋恣肆到平实克制,描写方式从油画式的铺张渲染到中国画线条式的简单勾勒,使高密东北乡从寓言性的精神原乡转变为实实在在的故乡。新时代中的乡村“新人”形象是小说书写现实的着
期刊