基于深度强化学习的机器人路径规划

来源 :制造业自动化 | 被引量 : 0次 | 上传用户:pan2009pan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统强化学习中Q学习算法在机器人路径规划过程中易引发维数灾难及搜索效率低的问题,提出一种深度强化学习算法。在Q学习算法中引入深度学习,通过深度学习网络对参数进行不断的训练和优化,利用网络输出值来替代传统的Q值表,从而避免陷入维度灾难。另外针对算法的过估计问题,设计了一种深度双Q学习策略,其中包含了两个网络结构对机器人的执行动作和决策评估进行分别计算。同时采用重回放机制,改善算法收敛性。最后,利用贝塞尔曲线对路径进行平滑。仿真表明,深度强化学习算法相较于Q学习算法,路径各项指标得以提升,对机器人工作运行更为有利。
其他文献
2020年新冠肺炎疫情是近年来最为重大的突发公共事件,其播速度快、感染范围广、防控难度高,在世界范围内产生重大影响。女性在疫情期间承担了重要的救援工作,是抗疫运动中的中坚力量。通过媒体的报道,她们的贡献与牺牲得以传递给大众。随着互联网的发展,微博成为各大媒体的舆论阵地和信息发布渠道,也是疫情期间媒体实时更新疫情动态的主要平台之一。《中国妇女报》作为我国唯一一份面向全国发行的中央级女性主流日报,在疫
针对当前心理健康智能机器人对学前儿童的语音情感识别准确率低,导致无法有效地对儿童进行心理辅导监测的问题,提出构建一个基于注意力机制Attention+长短期神经网络LSTM的学前儿童情感识别模型。该模型采用LSTM神经网络对原始语音中的时序关系进行保留,并在LSTM基础上,加入注意力机制,将传统遗忘门、输出门转换为注意力门,得到基于深度注意力门的Attention+LSTM模型,通过此模型对儿童语
低温甲醇洗技术在煤化工行业中的应用可以极大促进煤化工的发展,在减少中国能源短缺方面发挥着重要作用。低温甲醇洗技术在操作过程中不涉及化学反应,气体总吸收能力强,选择性气体吸收效果明显,吸收器价格低廉,能耗低,整个生产过程非常稳定。基于此,文章探讨了低温甲醇洗技术及其在煤化工中的应用。
鲁迅常用梦的渠道进行心理潜意识的表达,《野草》就是其中极具代表性的著作。从视觉心理的角度看,梦境和色彩是组成视觉意象的重要部分。在《秋夜》到《一觉》这场长梦中,一方面,梦作为载体,承载了色彩的视觉构造效果;另一方面,色彩又构建了“息息变幻,永无定形”的梦境。鲁迅为每一个梦境赋予不同底色,并通过其他颜色的修饰来完成整个梦境的色彩构图。这些单独的梦各自斑斓,却最终融合为黑色,即全书的底色。这种双重关系
都市圈同城化发展是当前我国区域经济一体化发展的突出表现形式,有利于区域间要素高效流动,促进区域间产业链协同融合,增强区域间协同治理能力。文章从要素、产业、交通和生态4个维度构建了都市圈同城化水平综合评价指标体系,基于变异系数法,对2010—2019年武汉都市圈9个城市的同城化水平进行测度,并从时间和空间两个维度对武汉都市圈同城化水平演变趋势进行分析。结果表明:研究期内武汉都市圈同城化水平较低,提升
目的 探讨依达拉奉联合神经节苷脂对急性脑梗死患者血清炎症因子水平及神经功能的影响。方法 选取2019年1月至2020年5月本院收治的92例急性脑梗死患者作为研究对象,按照随机数字表法分为对照组与观察组,每组46例。对照组应用依达拉奉治疗,观察组在对照组基础上加用神经节苷脂治疗,比较两组临床疗效、治疗前后美国国立卫生研究院卒中量表(NIHSS)评分、治疗前后炎症因子水平及不良反应发生情况。结果 观察
<正>摩托车、电动车被盗案是基层派出所常见的侵财性案件,各地呈高发态势且大多破案率不高。这类案件侵犯群众的财产权利,严重影响了公众安全感和公安机关满意率。对于办案人员来说,制作好报案笔录是侦办此类案件的第一个关键点,能为案件的侦破打牢坚实的基础。派出所办案人员需要结合此类案件的特点,紧扣盗窃罪的犯罪构成要件,
期刊