基于深度强化学习的机器人路径规划

来源 :制造业自动化 | 被引量 : 0次 | 上传用户：pan2009pan

【摘要】

：

针对传统强化学习中Q学习算法在机器人路径规划过程中易引发维数灾难及搜索效率低的问题，提出一种深度强化学习算法。在Q学习算法中引入深度学习，通过深度学习网络对参数进行不断的训练和优化，利用网络输出值来替代传统的Q值表，从而避免陷入维度灾难。另外针对算法的过估计问题，设计了一种深度双Q学习策略，其中包含了两个网络结构对机器人的执行动作和决策评估进行分别计算。同时采用重回放机制，改善算法收敛性。最后，利

【作者】

：

齐嵘吴宪凤

【机构】

：

包头广播电视大学

【出处】

：

制造业自动化

【发表日期】

：

2022年12期

【关键词】

：

Q学习深度强化学习机器人路径规划

【基金项目】

：

内蒙古广播电视大学2021年度教育教学研究重大课题攻关项目（EZDGG202104）;内蒙古广播电视大学2021年度科学研究一般课题（IMOU-EZDGGZ2125）；

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

“一箱难求”情景不再集装箱海运价格回落

报纸

集装箱海运价格货代企业运价水平航线运价

大多数人感染后不会引发心肌炎

报纸

心肌炎南方日报广州中医药大学第一附属医院

疫情期间女性形象的媒介呈现研究 ——以疫情期间《中国妇女报》和《新京报》微博报道为例

2020年新冠肺炎疫情是近年来最为重大的突发公共事件,其播速度快、感染范围广、防控难度高,在世界范围内产生重大影响。女性在疫情期间承担了重要的救援工作,是抗疫运动中的中坚力量。通过媒体的报道,她们的贡献与牺牲得以传递给大众。随着互联网的发展,微博成为各大媒体的舆论阵地和信息发布渠道,也是疫情期间媒体实时更新疫情动态的主要平台之一。《中国妇女报》作为我国唯一一份面向全国发行的中央级女性主流日报,在疫

学位

新冠疫情媒介呈现女性形象语义网络分析性别隔离

学前儿童心理健康智能机器人辅助监测系统设计

针对当前心理健康智能机器人对学前儿童的语音情感识别准确率低，导致无法有效地对儿童进行心理辅导监测的问题，提出构建一个基于注意力机制Attention+长短期神经网络LSTM的学前儿童情感识别模型。该模型采用LSTM神经网络对原始语音中的时序关系进行保留，并在LSTM基础上，加入注意力机制，将传统遗忘门、输出门转换为注意力门，得到基于深度注意力门的Attention+LSTM模型，通过此模型对儿童语

期刊

学前儿童心理健康监测语音情感识别注意力机制LSTM

低温甲醇洗技术及其在煤化工中的应用

低温甲醇洗技术在煤化工行业中的应用可以极大促进煤化工的发展，在减少中国能源短缺方面发挥着重要作用。低温甲醇洗技术在操作过程中不涉及化学反应，气体总吸收能力强，选择性气体吸收效果明显，吸收器价格低廉，能耗低，整个生产过程非常稳定。基于此，文章探讨了低温甲醇洗技术及其在煤化工中的应用。

期刊

低温甲醇洗技术煤化工

梦境与色彩的双重奏鸣曲——从视觉心理重读鲁迅《野草》

鲁迅常用梦的渠道进行心理潜意识的表达，《野草》就是其中极具代表性的著作。从视觉心理的角度看，梦境和色彩是组成视觉意象的重要部分。在《秋夜》到《一觉》这场长梦中，一方面，梦作为载体，承载了色彩的视觉构造效果；另一方面，色彩又构建了“息息变幻，永无定形”的梦境。鲁迅为每一个梦境赋予不同底色，并通过其他颜色的修饰来完成整个梦境的色彩构图。这些单独的梦各自斑斓，却最终融合为黑色，即全书的底色。这种双重关系

期刊

鲁迅《野草》视觉心理梦境色彩

武汉都市圈同城化水平测度及时空演变特征分析

都市圈同城化发展是当前我国区域经济一体化发展的突出表现形式，有利于区域间要素高效流动，促进区域间产业链协同融合，增强区域间协同治理能力。文章从要素、产业、交通和生态4个维度构建了都市圈同城化水平综合评价指标体系，基于变异系数法，对2010—2019年武汉都市圈9个城市的同城化水平进行测度，并从时间和空间两个维度对武汉都市圈同城化水平演变趋势进行分析。结果表明：研究期内武汉都市圈同城化水平较低，提升

期刊

武汉都市圈同城化水平时空演变变异系数法

深刻领悟“两个确立”的决定性意义全面把握中心任务弘扬团结奋斗精神推动各项工作迈出新步伐取得新成效

报纸

会泽县中国式现代化真抓实干

依达拉奉联合神经节苷脂对急性脑梗死患者血清炎症因子水平及神经功能的影响

目的探讨依达拉奉联合神经节苷脂对急性脑梗死患者血清炎症因子水平及神经功能的影响。方法选取2019年1月至2020年5月本院收治的92例急性脑梗死患者作为研究对象，按照随机数字表法分为对照组与观察组，每组46例。对照组应用依达拉奉治疗，观察组在对照组基础上加用神经节苷脂治疗，比较两组临床疗效、治疗前后美国国立卫生研究院卒中量表（NIHSS）评分、治疗前后炎症因子水平及不良反应发生情况。结果观察

期刊

急性脑梗死依达拉奉神经节苷脂炎症因子神经功能

摩托车、电动车被盗案报案笔录询问八要点

＜正＞摩托车、电动车被盗案是基层派出所常见的侵财性案件，各地呈高发态势且大多破案率不高。这类案件侵犯群众的财产权利，严重影响了公众安全感和公安机关满意率。对于办案人员来说，制作好报案笔录是侦办此类案件的第一个关键点，能为案件的侦破打牢坚实的基础。派出所办案人员需要结合此类案件的特点，紧扣盗窃罪的犯罪构成要件，

期刊

基于深度强化学习的机器人路径规划

与本文相关的学术论文