Balance Control of a Biped Robot on a Rotating Platform Based on Efficient Reinforcement Learning

来源 :自动化学报:英文版 | 被引量 : 0次 | 上传用户：w_zhou

【摘要】

：

In this work,we combined the model based reinforcement learning(MBRL)and model free reinforcement learning(MFRL)to stabilize a biped robot(NAO robot)on a rotati

【作者】

：

Ao Xi Thushal Wijekoon Mudiyan

【机构】

：

theDepartmentofMechanicalandAerospaceEngineering,IEEE,MonashUniversity,theUBTECHSydneyArtificialInte

【出处】

：

自动化学报:英文版

【发表日期】

：

2019年4期

【关键词】

：

BIPED robot GAUSSIAN processes(GP) REINFORCEMENT learning TEMPORAL DIFFERENCE

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

In this work,we combined the model based reinforcement learning(MBRL)and model free reinforcement learning(MFRL)to stabilize a biped robot(NAO robot)on a rotating platform,where the angular velocity of the platform is unknown for the proposed learning alg

其他文献

青川县中药材产业发展现状及建议

青川县作为农业大县,具备优良的农业产业优势及资源优势。其中,中药材产业是本地区域特色优势产业之一,为积极响应国家号召和时代发展需要,将中药材产业发展与精准扶贫结合起

期刊

青川县中药材产业发展建议

基于系数关系共生矩阵和SVM的纹理分析

纹理是图像中非常重要的特征。提出了一种新的纹理特征提取算法,即对纹理图像进行离散小波框架变换后,利用同一变换尺度下的小波高频系数与低频系数之间的依存关系信息,构造系数共生矩阵,在此基础上进行纹理特征提取,而不是独立地提取各子带系数特征。考虑支撑向量机(SVM)在小样本数据库和泛化能力方面的优势,在分类实验中采用支撑向量机分类器,实验结果表明,基于这种共生矩阵特征提取分类算法能得到很好的分类结果。

期刊

离散小波框架变换系数共生矩阵纹理特征支撑向量机discrete wavelet frame transform coefficient co-occur

工程项目成本控制的价值工程应用

成本管理是经济管理的一个重要方面,而价值工程是成本控制的最佳方法。本文从价值工程的角度分析了成本在经济活动中的作用,并对工程项目中的成本控制提出了相应的措施;指出

期刊

价值工程成本控制

海藻糖高产株Brevibacterium sp SY361海藻糖磷酸化酶（EC2.4.1.64）的纯化

目的研究分离纯化海藻糖高产株Brevibacterium sp SY361中海藻糖磷酸化酶的工艺,获得高纯度的海藻糖磷酸化酶。方法大量培养细菌Brevibacterium sp SY361,超声粉碎细胞,通

期刊

海藻糖磷酸化酶BREVIBACTERIUMSPSY361纯化trehalose phosphoryulase Brevibacterium sp SY

高层公共建筑给水排水工程节能途径探讨

建筑节能是我国经济发展中的重要国策。建筑给水排水的节能就是在建筑物的设计、建造和使用过程中执行建筑节能标准,采用节能型的给水排水工艺、设备、材料,提高系统效率和性

期刊

高层公共建筑给水排水节能途径

发动机经济效益的10种衡量方法

经济效益是理论观念上的质量,但往往由于轻率地使用该词而使它失去意义.可是您应知道,您必须对经济效益进行衡量,以做出正确的决策.这里所介绍的经济效益10种衡量标准,可帮助

期刊

发动机经济效益衡量方法有效作业率产品服务可靠性维修方便性发动机特点技术规格燃油利用率耐用性可保养性

Quadratic Stabilization of Switched Uncertain Linear Systems:A Convex Combination Approach

We consider quadratic stabilization for a class of switched systems which are composed of a finite set of continuoustime linear subsystems with norm bounded unc

期刊

ConvexcombinationlimearmatrixINEQUALITIES(LMIs)NORMBOUNDEDuncertainties

广西基本消灭恶性疟策略与方法研究

广西基本消灭恶性疟策略与方法研究，是在深入进行疟疾流行病学调查和试点研究的基础上，以自然村屯为单位划分疟分，分类防治。在全面攻击期，按上年疟史率的高低分类防治的“三根治

期刊

防治疟疾策略方法广西Falciparum malaria Prevention and control Basic elimination

幼师生职业素养培育策略探析

幼儿教师的职业素养需要长时间的培养才能形成。在教学中,教师应充分发挥课堂的主阵地作用,有效利用教学时间落实职业素养,主要方法有:利用课前"说话"提高学生的口语表达能力

期刊

职业素养表达能力思维品质沟通合作教育教学

一种基于视图和支持向量机的三维物体识别方法

为提高三维物体识别系统性能并减少计算复杂性，本文提出了一种基于视图的方法。首先从三维物体的二维视图中提取颜色矩、纹理特征和仿射不变矩。颜色矩对于物体的大小和姿态不

期刊

三维物体识别纹理分析颜色矩仿射不变矩支持向量机3D object recognition texture analysis color moments

Balance Control of a Biped Robot on a Rotating Platform Based on Efficient Reinforcement Learning

与本文相关的学术论文