移动机器人模糊Q-学习沿墙导航

来源 :电机与控制学报 | 被引量 : 0次 | 上传用户:ylfly5257
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对在基于行为的移动机器人沿墙导航控制器的设计中缺乏足够的先验知识的问题,采用Q-学习方法让机器人通过学习来自动构建导航控制器。将模糊神经网络和Q-学习相结合,用模糊神经网络直接逼近连续状态和动作空间中的Q值函数。利用对Q值函数的优化获得控制输出。模糊神经网络中的节点根据状态动作对的各个分量和时间差分的新颖性进行自适应地添加和构造,这样不仅能克服节点选择的困难还能使网络保持适度的规模。网络中的参数采用扩展卡尔曼滤波方法进行自适应调整。基于Khepera 2机器人的沿墙导航实验验证了该方法的有效性和优越性。
其他文献
文中介绍了美国贝尔实验室的创新途径。分析发现,其创新途径主要包括人员的交流、组织管理、研究方向的自由、人才的选拔与培养和科学精神的传承。借鉴贝尔实验室的创新途径,
自动控制理论是电气工程与电子信息工程两大类学科的专业基础课,其教学效果的好坏,直接影响到学生后续专业课程的学习以及分析问题解决问题能力的培养。而《自动控制理论》现有
产业集聚是当今世界经济中颇具特色的经济组织形式,特别集中在高新技术产业领域.集聚区内的企业通过合作与交流可以发挥规模经济效应,同时可产生强大的溢出效应.本文主要从高
在对国家和地方政府关于仪器设备开放共享的政策和制度进行了研究的基础上,提出了区域仪器设备开放共享涉及的三大主体,地方政府、高校、企业三方面对高校仪器设备开放共享的
磁化曲线计算是SRM解析计算的关键,现有的磁化曲线计算公式大多针对多极数低速SRM,不适用于高速运行的低极数SRM。本文在传统8/6极低速SRM磁化曲线的基础上,推导了4/2极高速S
针对励磁机励磁电流频谱存在的故障频率成分随机偏移、不便于在线提取的问题,结合分形理论与动态测度的概念提出了一种无刷发电机旋转整流器故障诊断方法。根据励磁机励磁电流
文章以文化殖民主义为视角,分析从GATT到WTO的贸易自由化进程,说明贸易自由化是以美国为首的西方文化殖民主义战略实施的重要载体,中国在贸易自由化进程中应积极发展民族文化产