基于深度强化学习的机器人轨迹规划方法研究

来源 :北京建筑大学 | 被引量 : 0次 | 上传用户:feilang166
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,随着深度学习等技术的发展,机器人系统的智能化水平越来越高,在工业、医疗等行业取得了较好的应用。人们期待未来机器人能够走进人们的生活,与人共存,为人提供服务,这要求机器人不仅具有较好的移动能力、作业能力,还需要具备对人居等复杂非结构化环境的适应能力。能够自动辨识系统环境,并依据环境变化动态调整其移动和作业轨迹。非结构化环境下的轨迹规划,是机器人领域研究的难点之一。本文在对比分析现有机器人轨迹规划方法的基础上,将深度强化学习引入机器人轨迹规划,开展非结构化动态环境中的机器人轨迹规划研究。一方面针对移动机器人的二维平面运动,将人工势场法和改进的双重深度Q网络相结合,实现移动机器人非结构化动态环境的轨迹规划;另一方面针对六自由度机械臂的三维空间运动,提出一种基于软演员-评论家和g SDE的机械臂轨迹规划方法。在此基础上,本文进一步研究离散型和连续型深度强化学习在非结构化动态场景中,探索效率低下和算法奖励稀疏的问题。本文的主要工作如下:首先,介绍机器人动态轨迹规划及深度强化学习的国内外研究现状,阐述深度强化学习方法在机器人动态轨迹规划中的应用情况,分析比较经典规划理论和深度强化学习规划方法的优缺点。然后,对机器人运动学模型进行分析,并对比研究机器人动态轨迹规划的人工势场方法、深度强化学习方法和g SDE方法。其次,在此基础上,将深度强化学习方法与传统轨迹规划方法结合,提出PF-IDDQN四轮移动机器人二维平面运动轨迹规划方法;将高效探索方法与深度强化学习方法结合,提出了g SDE-SAC的六自由度机械臂三维空间运动轨迹规划方法。上述两种方法提高算法的奖励函数值、轨迹规划的成功率和机器人的探索效率,使机器人可在非结构化动态环境中自主移动和作业。最后,在以四轮移动机器人和六自由度机械臂为基础的仿真平台上验证本文提出的两种改进算法,设计仿真实验环境和实验任务,以评估所改进算法的性能。结果表明,本文提出的PF-IDDQN算法使得移动机器人在非结构化动态环境中,可以在有限探索次数内到达目标位置,算法的实验成功率达到97%以上,平均奖励值提高230,而经典算法无法完成任务;基于本文提出的g SDE-SAC算法使得机械臂在非结构化动态环境中可以抓取目标物体,并规划出一条通往目标位置的无碰撞轨迹,相对经典SAC算法,本文提出算法的实验成功率和奖励函数值分别提高了约12%和19%,验证了算法的有效性。
其他文献
氮和磷过度排放会破坏水生态环境,为此开发高效、廉价的废水脱氮除磷材料,对缓解水体富营养化具有重要意义.利用天然磁黄铁矿、黄铁矿和低硫精矿(Low sulfur concentrate简称LSC)构建铁硫矿物自养反硝化脱氮除磷体系,考察了不同铁硫矿物自养反硝化脱氮除磷性能,探究了黄铁矿、磁黄铁矿相互作用机理和反应前后微生物群落变化.结果表明,相较于黄铁矿、磁黄铁矿,LSC具有更高的平均脱氮速率(0.
目的:观察当归、黄芪、女贞子提取物外用对睾酮诱导的C57BL/6小鼠脂溢性脱发模型的影响及其机制探讨。方法:外用睾酮3周诱发C57BL/6小鼠脂溢性脱发模型,观察涂抹不同浓度当归、黄芪、女贞子提取物后小鼠背部皮肤的颜色变化,新生长度和毛发覆盖率,观察小鼠皮肤厚度和毛囊组织学变化情况;检测鼠皮肤中α-MSH,TGF-β1和VEGF因子水平。结果:当归、黄芪、女贞子醇提物均能促进脂溢性脱发小鼠的毛发生
酒店是旅游者进入旅游目的地的起点和终点,好的入住体验能够提升旅游者对旅游目的地的整体印象。发挥“城市的会客厅”功能的高星级旅游酒店,在旅游宣传中经常被当作城市名片。凭借充足的投入,高星级旅游酒店的硬件设施通常较为优越,而服务质量却成为制约酒店发展的关键,因此,人力资源管理是酒店管理中的重要环节。酒店企业属密集型行业,员工队伍存在挤占运营成本高、流动性大、学历层次低、薪酬敏感性强等特点。新冠疫情暴发
挥发性有机物(VOCs)在大气复合污染、雾霾、臭氧污染等空气质量降低过程中起到关键作用,对人体健康有巨大威胁。VOCs成分复杂、来源多样,源头减排是对其最有效的控制手段。而探究VOCs排放来源,构建排放清单,识别特征污染物,是寻求针对性减排方案的重要依据。本研究以国民经济行业为工业企业类别划分依据,包括33个Ⅰ级类别,179个Ⅱ级类别,199个Ⅲ级类别,具有更高的实际参考价值。依据济南市20家企业
<正> 石油炼制职工接触有机溶剂、酸、碱物质机会较多,职业体检中发现部分职工患指甲病损,于是进行了专题调查。剔除患有急慢性肝病、心血管疾病、贫血、雷诺氏症、霉菌感染等病史及外伤史者,实查315人,分为直接接
期刊
鉴于目前尚未有学者对重庆果园港船舶大气污染物排放进行专门研究,这制约着港区进一步更新和制定有针对性的船舶大气污染物排放控制方案。为有效治理港区环境,助力决策者确定大气污染物排放削减目标的可达性和科学制定大气污染物排放控制策略,响应国家“双碳”战略,保护自然环境及居民身体健康。本文首先以船舶档案数据和AIS数据为基础,采用基于船舶引擎功率的排放因子法对果园港2021年9月-10月船舶大气污染物排放清
针对新能源并网对电网电能质量的影响问题,通过设置不同的函数,实现了新能源并网影响电能质量的特性量化分析。并将新能源并网对电网电能质量的影响转换为数学形式的思维,以量化的方式解决实际问题,提高了实际问题分析能力。文章还构建了灰色关联模型,以便用户通过一种数据影响量分析其他数据影响量。通过试验,提出的方法评估误差低。
2016年5月,“营改增”税制改革在全国范围内推行,营业税也就此退出了历史舞台。此次改革的目的是为了完善增值税链条,消除重复征税,降低企业税负,促进企业转型升级。作为“营改增”改革难点的房地产业也终于纳入税制改革行列中,这为房地产企业带来了机遇,同时也迎来了挑战。本文以此为背景,以商业地产为立足点,分析“营改增”对商业地产行业的具体影响以及是否达到政策效果。虽然我国商业地产的发展时间并不长,但随着
本文的研究对象泰语潮剧,特指狭义的泰国潮剧中“泰化潮剧”的一支。1982年,为庆祝曼谷建都200周年而创作的《包公铡侄》,是第一部泰语潮剧,其被视为泰语潮剧诞生的标志。泰语潮剧是顺应泰国潮剧本土化趋势应运而生的戏剧艺术,也是泰国华人为适应本土社会所做的主动选择。为区别于传统潮剧,泰语潮剧在戏曲音乐上呈现继承性、包容性、创新性三个基本特征,是以改“潮语”为“泰语”,融合中、泰传统音乐元素,服务于以王