【摘 要】
:
针对传统增强学习方法在运动规划领域,尤其是机器人避障问题上存在容易过估计、难以适应复杂环境等不足,提出了一种基于深度增强学习的提升机器人避障性能的新算法模型。该模
【机 构】
:
西安电子科技大学雷达信号处理国家重点实验室,西安电子科技大学信息感知技术协同创新中心
【基金项目】
:
国家自然科学基金(61771361),国家自然科学基金杰出青年基金(61525105).
论文部分内容阅读
针对传统增强学习方法在运动规划领域,尤其是机器人避障问题上存在容易过估计、难以适应复杂环境等不足,提出了一种基于深度增强学习的提升机器人避障性能的新算法模型。该模型将dueling神经网络架构与传统增强学习算法Q学习相结合,并利用两个独立训练的dueling网络处理环境数据来预测动作值,在输出层分别输出状态值和动作优势值,并将两者结合输出最终动作值。该模型能处理较高维度数据以适应复杂多变的环境,并输出优势动作供机器人选择以获得更高的累积奖励。实验结果表明,该新算法模型能有效地提升机器人避障性能。
其他文献
介绍鸟类蛋黄中类固醇性激素的种类以及分布,并着重讨论其来源及其对幼鸟的重要生理意义.
研究背景:甲基苯丙胺(methamphetamine, METH)外观似冰,俗称“冰毒”,是一种无色、无臭的纯白结晶或粉末,属于苯丙胺类中枢神经兴奋剂。甲基苯丙胺目前已成为全球第二位广泛使
通过对青海省电力公司各应用系统存在多账号、多次登录问题的分析,提出了利用目录技术解决多系统统一人口问题,并详细介绍了目录技术在青海电力公司一体化平台中的应用及效益
通过检索数据库,查阅相关文献、综述中大数据在中医药领域中的应用,以及查看政府门户网站政策法规,了解中医药发展政策指向,发现中医药事业的发展已经步入大数据时代,大数据
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
随着系统芯片复杂度的持续提升,不断增加的带宽需求和不可预测的线延迟使总线逐步成为提高系统芯片性能的瓶颈.总线仲裁器对系统芯片的性能起决定作用,所以对高效仲裁器的研
天然水体中存在浮游动植物等体细胞和游离ATP,会对细菌ATP的测定产生严重的干扰,所以探究体细胞和游离ATP的消除方法是生物发光法测定细菌总数中不可缺少的预处理步骤.本文研
针对带隙基准电路对集成电路精度的影响,提出了一种新的低温漂带隙基准电路。通过分段温度补偿,补偿了带隙基准电路,减小了温度漂移,优化了基准的温度性能。基于西岳公司3μm
本文针对机场灭火救援形势越来越复杂化,尤其是对需要追逐迫降滑行中的飞机进行灭火的特殊状况及消防难题的研究分析。本文以满足机场灭火快速扑救的实战需要为目标,将其主要