基于深度Q网络学习的机器人端到端控制方法

来源 :仪器仪表学报 | 被引量 : 0次 | 上传用户:newlifeinsydney
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高机器人在没有障碍物地图或者激光雷达数据稀疏情况下进行无碰撞运动的准确性,将强化学习与深度学习方法融合,提出了一种基于深度Q网络学习的机器人端到端控制方法。首先,利用传统Q学习方法进行强化学习,生成大量的有标签数据样本;然后,利用深度神经网络构建从激光雷达数据输入到机器人运动速度输出的端到端控制模型,该模型由输入层、输出层和两个全连接层组成;最后,在仿真环境中完成了模型的训练和评估,并将其部署在机器人平台上测试。实验结果表明,该方法训练生成的模型有效地建立了激光雷达数据与机器人运动速度之间的映射关系,按照这种映射关系,机器人在每一个控制周期选择Q值最大的动作执行,能运动平顺地规避障碍物。
其他文献
骶髓后连合核(Sacral dorsal commissural nucleus,SDCN)位于骶髓中央管背侧灰质,主要接受盆腔脏器的感觉传入,盆腔内脏感觉信息在此中继,是参与盆腔内脏伤害性信息传递的重
舰船长期在海洋环境中服役,因此其压气机叶片等关键部件直接受到高速、高压、朝湿气流的冲刷和腐蚀,其中由腐蚀、磨损造成的损伤与失效尤为突出。本文针对某船国产化研究,分析了
经过50多年的发展,我国农村信用合作社已发展成为一个有着自身特色的金融组织,在支持农民、农业和农村经济发展中发挥了重要作用,已逐步成为我国农村金融的主力军和联系广大
单点渐进成形是在数控机床上通过计算机程序控制形状简单的成形工具,利用其运动轨迹对金属板料进行连续局部塑性成形的加工方法,在板类件成形领域有着广泛的应用前景。该成形
传统的摇臂钻床设计通常采用经验、类比的方法,但对其结构并未进行分析和计算,随着经济的快速发展,对大型摇臂钻床的需求越来越多,对其支承件进行参数化建模与有限元分析具有
不同于生存理性、经济理性和社会理性,生活理性是存在于日常生活中、蕴含在实践活动内的一类理性;它会与特定的社会文化相契合,具有本土化色彩。从社会学视角出发,考察生活理
马克思没有专门论述文明的著述,但他创建的唯物史观为我们研究文明问题提供了理论指导,他揭示的人类社会发展规律其实就是文明发展的规律。本文将从唯物史观提供的科学方法论
<正> 治疗方法:胎儿娩出后,在产妇的脐孔部(神阙穴)平平铺上一层很薄的食盐,然后将搓得很紧、形如绿豆大的艾绒放在盐层的中央,灸3~7壮(一般用3壮,阴道内有不断出血者用7壮)。
目的分析心血管内科护理管理中的风险因素,并提出安全防范对策。方法研究纳入该院心血管内科在2017年11月-2019年1月收治的68例患者,按照随机数字表法将其分成两组,各34例。
<正>序幕北平郊外的卢沟桥,一颗颗侵华日军罪恶的炮弹呼啸着落下,猛烈爆炸。卢沟桥上一只只石头狮子,在强盗的炮火中怒目圆睁。卢沟桥的前方,晃动着许多钢盔——大批日军在其