强化学习在机器人动作选择与控制中的运用

来源 :北京大学 | 被引量 : 0次 | 上传用户:happywz521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习是智能体通过与环境的交互获取知识与能力的一种学习机制,适用于智能体在外界环境模型未知的情况下进行自主学习以求适应环境的问题,与传统的通过自顶向下的预设规划模式来体现智能的方式不同,它是一种完全基于行为的自主学习,它的智能完全是通过自主学习来获取并得以体现的.倒立摆的平衡控制是典型的非线性控制问题,其理论模型与机器人的平衡控制直接相关,该文论述了利用强化学习进行倒立摆系统自主平衡控制的学习方法,仿真试验表明,该方法在这一问题上行之有效.机器人足球是一个很好的测试机器人"智能"的平台,由于球场形势的千变万化以及场地条件的差异,机器人球员需要很强的自主学习能力才能适应各种场地各种环境下的挑战,该文的后一部分就论述了利用强化学习进行守门员机器人的守门学习方法,并通过仿真实验验证了所提出方法的有效性与可靠性.
其他文献
随着信息化社会的到来,人们对信息量的需求与日俱增,因而,优势在于巨大带宽和低传输损耗的光纤通信,一直朝着高速率、大容量的方向发展,以满足迅速增长的对通信带宽的需求.随
近几年短距离无线通信系统(从10m到100m),由于数据业务的推动,呈现出巨大的发展潜力,尤其是提出了无线个人局域网(PAN)的概念,PAN的核心思想是用无线电或红外线代替传统的有
贫营养微生物存在于一些营养贫瘠的极端环境中,具有独特的生态学意义。荒漠化土壤中存在着一些贫营养细菌,有研究表明,它们在生长过程中会分泌胞外多糖等黏性物质,可以粘结土
传统电信网络业务模型为泊松模型,一直以来人们围绕泊松模型做了大量的研究和分析,并得到了众多宝贵的结论.但是在90年代初期,BellCore和Boston大学的研究人员通过对于Ethern
ADP核糖基化因子(Arfs)是真核细胞中广泛表达的且是高度保守的GTP结合蛋白家族,是Ras超家族成员之一。从生化特性和序列的相似性上,Arfs蛋白分为Arf蛋白和Arf相似蛋白。Arf蛋白
重楼属Paris隶属延龄草科Trilliaceae,共有24个种,主要分布在远东地区的热带及温带地区。我国有19个种,主要分布在西南地区。本属植物是重要的中草药,在被子植物系统发育的研究中也有着重大意义。本文从两方面对重楼属植物进行了研究:(1)同域分布两种重楼植物形态、遗传分化;(2)黑籽重楼原变种和无瓣黑籽重楼的形态分化 (1)对峨眉山2种重楼一小重楼(Paris polyphylla
本文通过对荣华二采区10
期刊
本文通过对荣华二采区10
期刊
该文采用二维单向耦合映射格点(OCML)时空混沌加密算法,实现了基于公用电话网(PSTN)的实时语音全双工保密通信系统.该文首先分析了二维OCML时空混沌加密算法在安全性、加密效
摘要:初中英语教学中,语音教学是其基础,初中生只有学好语音,才能掌握音标与单词,为接下来的学习奠定良好的基础。但是在教学中,由于教师的教学方法比较机械,致使学生对语音的学习效果很不理想。因此,本文针对如何提高初中英语语音教学效果进行分析论述,旨在能够给初中英语教学者提供有效参考。  关键词:初中英语;语音教学;研究  引言:语音教学在初中英语教学中占有重要地位,语音的学习是初中生学好英语的基础。对