Balance Control of a Biped Robot on a Rotating Platform Based on Efficient Reinforcement Learning

来源 :自动化学报:英文版 | 被引量 : 0次 | 上传用户:w_zhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
In this work,we combined the model based reinforcement learning(MBRL)and model free reinforcement learning(MFRL)to stabilize a biped robot(NAO robot)on a rotating platform,where the angular velocity of the platform is unknown for the proposed learning alg
其他文献
青川县作为农业大县,具备优良的农业产业优势及资源优势。其中,中药材产业是本地区域特色优势产业之一,为积极响应国家号召和时代发展需要,将中药材产业发展与精准扶贫结合起
纹理是图像中非常重要的特征。提出了一种新的纹理特征提取算法,即对纹理图像进行离散小波框架变换后,利用同一变换尺度下的小波高频系数与低频系数之间的依存关系信息,构造系数共生矩阵,在此基础上进行纹理特征提取,而不是独立地提取各子带系数特征。考虑支撑向量机(SVM)在小样本数据库和泛化能力方面的优势,在分类实验中采用支撑向量机分类器,实验结果表明,基于这种共生矩阵特征提取分类算法能得到很好的分类结果。
成本管理是经济管理的一个重要方面,而价值工程是成本控制的最佳方法。本文从价值工程的角度分析了成本在经济活动中的作用,并对工程项目中的成本控制提出了相应的措施;指出
目的 研究分离纯化海藻糖高产株Brevibacterium sp SY361中海藻糖磷酸化酶的工艺,获得高纯度的海藻糖磷酸化酶。方法 大量培养细菌Brevibacterium sp SY361,超声粉碎细胞,通
建筑节能是我国经济发展中的重要国策。建筑给水排水的节能就是在建筑物的设计、建造和使用过程中执行建筑节能标准,采用节能型的给水排水工艺、设备、材料,提高系统效率和性
经济效益是理论观念上的质量,但往往由于轻率地使用该词而使它失去意义.可是您应知道,您必须对经济效益进行衡量,以做出正确的决策.这里所介绍的经济效益10种衡量标准,可帮助
We consider quadratic stabilization for a class of switched systems which are composed of a finite set of continuoustime linear subsystems with norm bounded unc
广西基本消灭恶性疟策略与方法研究,是在深入进行疟疾流行病学调查和试点研究的基础上,以自然村屯为单位划分疟分,分类防治。在全面攻击期,按上年疟史率的高低分类防治的“三根治
幼儿教师的职业素养需要长时间的培养才能形成。在教学中,教师应充分发挥课堂的主阵地作用,有效利用教学时间落实职业素养,主要方法有:利用课前"说话"提高学生的口语表达能力
为提高三维物体识别系统性能并减少计算复杂性,本文提出了一种基于视图的方法。首先从三维物体的二维视图中提取颜色矩、纹理特征和仿射不变矩。颜色矩对于物体的大小和姿态不