基于学习分类器的多机器人路径规划收敛性研究

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:hufei1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,学习分类器LCS已广泛用于基于归纳学习的强化学习领域,但很少用于多机器人领域.提出了一种基于集成强化学习和遗传算法的学习分类器用于多机器人路径规划领域.由于遗传算法具有早熟收敛、局部最优解和占据较大的存储空间等缺陷,针对静态和动态环境因素对多机器人路径规划的不同影响,设计了在静态和动态环境下不同的适应度函数,在理论上推导并证明了信用分配算法的收敛性,为路径规划算法的收敛提供了理论保证.仿真实验结果也表明遗传算法和学习分类器结合用于多机器人的路径规划是有效的,遗传算法的早熟收敛、局部最优解、占据存储
其他文献
智能规划和调度中的许多时态(或时序)问题可以表达为析取时态问题(DTP).目前,多数析取时态问题求解器将析取时态问题看作约束可满足问题(CSP)或可满足问题(SAT),并使用标准的CSP(或SAT)技