基于模糊ART和Q学习的路径规划

来源 :中国人工智能学会第10届全国学术年会 | 被引量 : 0次 | 上传用户：lipz7517

【摘要】

：

本文对基于模糊ART和Q学习的路径规划进行了探讨。Q学习是一种强化学习方法，它实现从状态空间到有限的动作集合的映射，并通过环境给出的强化信号对网络进行学习。由于强化信号

【作者】

：

赵慧蔡自兴邹小兵

【机构】

：

中南大学智能系统与软件研究所长沙 410083

【出处】

：

中国人工智能学会第10届全国学术年会

【发表日期】

：

2003年期

【关键词】

：

模糊 ART 增量学习状态空间环境状态人工势场法动态障碍物学习方法信号对网络路径规划极值问题映射突变离散局部集合划分动作

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文对基于模糊ART和Q学习的路径规划进行了探讨。Q学习是一种强化学习方法，它实现从状态空间到有限的动作集合的映射，并通过环境给出的强化信号对网络进行学习。由于强化信号要求的环境状态是有限的、离散的，所以引入模糊ART网络对状态空间进行划分。结合传统的人工势场法，避免了局部极值问题，可以实现增量学习，适用于环境存在突变和动态障碍物的情况。

其他文献

一种非线性系统的在线时滞辨识方法

本文提出了基于神经网络的直接和间接对非线性动态系统的时变时滞的在线时滞辨识方法。其中间接估计法将时滞辨识视为非线性动态优化问题，而直接辨识法则利用动态神经网络构成

会议

非线性系统在线时滞辨识神经网络非线性动态系统动态优化问题直接和间接间接估计法直接辨识网络构成时变时滞利用动态辨识方法估计器跟踪法则

基于产品工作流的产品建模

提出一种扩展对象Petri网产品模型EOPN，其集成了对象模型、非结构化模型和Petri网模型，特别是根据旋转动力学理论将对象属性推广到流形，以刻画属性的非均匀变化。进而提出这种模

会议

基于AI的地方政府财政复杂系统决策控制研究

地方政府财政系统是一个典型的社会经济复杂系统，要实现对政府财政的决策和控制，传统方法存在一定不足。本文针对政府财政系统的特点，提出基于人工智能的方法，首先建立基于agent

会议

开关磁阻电机系统的控制

针对开关磁阻电机系统的几种主要控制方式，给出了其模糊控制器输入变量的选择、模糊控制器输出变量的选择、输入变量的模糊化和输出变量精确化的方法。

会议

开关磁阻电机系统模糊控制器输入变量输出变量控制方式模糊化精确化方法

印尼语被动语态常见错误分析

印尼语被动语态的掌握和运用易发生错误,每一届学生每门课程作业中多多少少都存在着这一问题。而印尼语被动语态使用较主动语态更为频繁,尤其是书面语,所以正确掌握和使用这

期刊

被动语态常见错误

智能控制课程建设：回顾与前瞻

本文首先着重回顾了中南大学智能控制课程设立和发展过程，总结了本课程建设中的一些做法和经验，如优化和更新教学内容，精益求精编好和使用好教材，综合采用各种现代教学手段，以及建

会议

FIRA仿真足球机器人及其射门动作的智能化设计

本文对FIRA仿真足球机器人及其射门动作的智能化设计进行了研究。文章主要介绍了机器人足球FIRA系列仿真机器人的设计步骤以及神经网络在射门动作中的应用。

会议

仿真足球机器人射门动作智能化设计机器人足球仿真机器人神经网络设计步骤文章

基于运动环境模型的移动机器人路径规划

本文建立了移动机器人实验规划系统，定义并设计了基于超声波阵列的环境模型知识库。开发了在半已知环境下，采集多传感器信息，借助先验知识库的监督，探测并识别场景状态和典型目标

会议

一种移动机器人复合定位系统的设计

本文介绍了一种基于多传感器信息融合的移动机器人复合定位系统的设计，该系统由惯性定位系统、GPS定位系统和视觉定位系统组成。通过多传感器信息融合技术实现机器人的自身定

会议

移动机器人复合定位系统多传感器信息融合惯性定位系统GPS定位系统自身定位系统组成适应能力视觉定位技术实现复杂环境定位精度可靠性设计

基于ADuC812的远程数据采集系统

本文在阐述ADuC812单片机的特性的基础上，结合CAN总线技术，提出了一种基于ADuC812远程数据采集系统的设计，并详述了其硬件结构、工作原理以及软件设计。

会议

ADuC812单片机远程数据采集系统CAN总线技术硬件结构软件设计工作原理基础

基于模糊ART和Q学习的路径规划

与本文相关的学术论文