基于深度强化学习的双足机器人跳远运动控制的研究

来源 :东莞理工学院 | 被引量 : 0次 | 上传用户:yan19891989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双足机器人形态拟人,具有多关节的结构,已经在灾害救援、商业表演、家庭娱乐等领域投入使用,得到了研究者的广泛重视。近几年来,许多研究者投身于深度学习结合强化学习在双足机器人上的应用研究。然而大多数的研究依然停留在较为简单的步行运动控制上,无法充分挖掘双足机器人多关节的潜力和发挥深度强化学习算法的训练优势。强化学习,结合深度学习的表征能力,可根据机器人与环境进行互动产生的数据进行不断地优化与学习,从而得到一个无需人工设计的控制器。本文针对双足机器人较复杂的跳远运动问题,开展基于深度强化学习在双足机器人跳远运动控制上的研究,主要研究工作为:首先,分析了双足跳远运动。双足跳远运动需要在一定方向上有足够的力才能向上跳跃完成跳远运动,并分析深度强化学习算法模型;构建了用于深度强化学习的相关仿真训练环境,最后选择使用Pybullet仿真环境做进一步地研究。其次,设计了人类运动重定向算法。在Pybullet仿真环境的无重力条件下,基于捕捉的人类动作中关键点的三维位置信息,设计重定向算法将人类运动重定向到NAO双足机器人上。研究结果表明,基于人类跳远动作的关键点信息,所设计的人类运动重定向算法可实现NAO双足机器人在无重力条件下的跳远运动,得到跳远运动的关节角度数据。最后,设计了输入空间、奖励函数和输出空间。分析双足跳远运动的特点和深度强化学习算法的改进;基于重定向获得的关节角度数据,将肩部、足部等关节角度数据作为输入状态空间的一部分,同时,将脚底传感器的反馈作为奖励函数的一部分。实验研究表明,基于设计的输入空间、奖励函数和输出空间,提高了跳远运动的训练效率和奖励值的收敛效率以及系统的鲁棒性,可实现NAO双足机器人向上跳跃的运动。本文设计的方法,通过强化学习的学习能力和深度学习的表征能力,能够令NAO双足机器人通过模仿人类动作实现向上跳跃的运动,挖掘了双足机器人多关节的潜力,为双足机器人的复杂运动开辟了新的道路,能够应用到一些复杂地形的场景上。
其他文献
利用基于气相色谱-质谱联用(gas chromatography-mass spectrometer, GC-MS)的代谢组学方法考察了保元汤治疗血虚证小鼠的作用机制;对昆明种小鼠腹腔注射环磷酰胺(cyclophosphamide, CTX),建立了以白细胞减少为特征的血虚证小鼠模型,设立空白对照组、模型组、阳性对照组以及保元汤低、中、高3个剂量的给药组,连续给药14 d。采用GC-MS技术对各实
目的:使用GRADE系统方法学,遵循“循证为主、共识为辅、经验为鉴”的原则,研究编制《中成药治疗更年期综合征临床应用指南》,为临床一线西医、中医、中西医结合专科医生及基层医院医生治疗更年期综合征提供中成药选择的原则和指导,提高中成药治疗更年期综合征临床疗效,避免不合理用药。方法:1.成立工作小组并开始进行指南研究工作,进行指南研究及编写。同时建立指南标准化项目咨询小组专家库,以便在之后进行课题的问
碳纳米管因其优越的性能受到广泛关注。通过对比电弧放电法、激光烧蚀法、化学气相沉积法等现有主流碳纳米管生产技术的优缺点,分析碳纳米管生长机理,对比反应器形式对反应条件的影响,提出了适用于规模化生产的工艺技术。着重梳理了碳纳米管作为吸附材料、橡胶改性材料、聚合物改性材料、沥青改性材料等规模化应用的进展,分析了限制碳纳米管大规模应用的主要原因,探讨碳纳米管在炼油及石油化工领域的应用前景,以期促进碳纳米管
光时域反射仪(Optical Time Domain Reflectometry,OTDR)作为一种光纤故障检测仪表,可对光纤的长度、光纤的传输衰减和故障定位等进行测量,在光纤光缆的各领域得到了广泛的应用。OTDR信号曲线可以反映背向散射光沿光纤传输中的损耗分布情况,但由于环境及系统的影响使得曲线上的事件点容易被噪声淹没,当曲线受噪声污染严重时,曲线中的事件难以识别。为了解决光时域反射仪中背向散射
对干扰源/辐射源目标的无源定位在卫星通信和无线通信网络中都具有十分重要的地位和作用。与雷达定位相比,这种定位方法所采用的被动定位模式无需自身发射电磁波,能够实现静默无线电定位,,因而在航空、航天、航海等领域都具有极高的研究应用价值。本文首先分析了双星TDOA/FDOA联合定位参数估计的原理和定位原理,推导了双星TDOA/FDOA联合定位表达式,以及GDOP(定位精度几何稀释)表示定位精度的原理。通
<正>今年是《计量法》实施三十五周年。三十五年来,我国的计量法制体系建设取得了辉煌成就,计量法律法规建设日益完善。基本形成了以《计量法》为主体,由计量行政法规和计量技术法规组成的国家计量法规体系。以法定计量检定机构为主体,由行业主管部门和社会计量技术机构组成的国家计量技术体系。逐步形成了国家、省级、地市级和县区级四级市场监管部门组成的计量行政监督管理体系,负责组织《计量法》的实施,保证全国单位统一
期刊
随着“互联网+”的提出,智能家居的发展为我们提供了很多便捷的技术成果。本设计是基于电力线载波技术的智能开关控制系统,采用多电源供电,以保证各支路的正常运行,设计多条支路,模拟多种故障情况。智能开关采用电力电子开关代替机械开关,这种开关响应速度更快,没有触点,寿命更长,可以频繁控制关断。基于单片机的电力线载波单相电能计量装置通过对数据及信号的处理,将反馈信号发送到开关上的无线或者蓝牙节点进行开关的分
<正>引言在初中英语教学过程中,教学单元由于是承载主题意义最为基本和最为完整的单位,因此每一个英语教学单元都会围绕着相关的主体进行编排,才能使学生在学习过程中和教师教学过程中实现逐层递进的目的,从而符合教育教学认知和规律的需求。基于此,文本就单元整体教学视角下初中英语教学设计的应用进行深入分析,为初中英语教育教学提供必要的参考借鉴。
期刊
初中英语教学既要重视基础知识的落实,也要重视以素养为立意实现教学目标,开展基于主题意义的单元整体教学。主题意义引领下的单元整体教学应先依据课程标准,分析单元内容,提炼单元主题意义,然后依据学情并围绕单元主题意义制订单元教学目标与课时教学目标,在此基础上践行英语学习活动观设计教学活动,引导学生基于对各语篇内容的学习和主题意义的探究,逐步建构和生成围绕单元主题的深层认知、态度和价值判断,促进学生核心素
建设国际消费中心城市对推动重庆高水平对外开放和经济高质量发展具有重要意义。本文依据建设国际消费中心城市的国际知名度、消费繁荣度、商业活跃度、到达便利度和消费舒适度等维度标准,研究发现重庆建设国际消费中心城市已具备战略地位日趋凸显、消费环境持续向好和综合实力稳步上升等基础优势,但仍存在国际影响力较弱、人均消费水平相对偏低等现实瓶颈。鉴于此,本文从优化功能空间布局、促进区域协同创新、完善城乡消费网络、