多智能体增强式学习及其在多机器人协调中的应用研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:ayahaha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多智能体系统(MAS)中,最集中和关键的问题表现在多智能体的学习及相应的协调合作机制上.我们根据国际上多智能体系统的研究情况,并针对面向管道检测多微小型移动机器人实际特点,提出了我们的研究课题,该博士论文的主要内容及创新点如下:1)采用Multi-agent System(MAS)理论来研究多机器人协调问题.2)将博弈论思想引入到多智能体的增强式学习中,提出一种特殊联合奖赏函数结构形式.3)提出一种基于传导径迹的多智能体Q学习,智能体不需要知道其他智能体的Q函数结构,只需维持其他智能体动作行为的传导径迹.4)采用MLPs(多层感知器)来泛化多智能体的状态空间,结合Q学习在线地更新MLPs的连接权值,解决了MLPs的过拟合缺陷,同时还可以节约存储空间.5)采用国家自然科学基金课题组研制的毫米级微小型移动机器人SJTU-MRⅠ和SJTU-MRⅡ,搭建了模拟面向管道检测的多微小型移动机器人环境系统,建立了多微小型移动机器人系统实验平台.由于当前国内微器件的加工水平,我们研制的微小型移动机器人还只能用于特定的工作环境中.我们建立了一个面向管道检测的毫米级多微小型移动机器人实验平台,虽然该平台还不完善,但它为面向管道检测的多微小型移动机器人协调研究提供了一个良好的开端.随着中国微器件加工工艺的不断提高和科研人员的努力,想念一定可以研制出实用的面向管道检测的多微小型移动机器人系统.
其他文献
该论文所阐述的数据采集系统采用PHILIPS公司的USB接口芯片D12与单片机进行通信,并和PC机通信而编制出友善的设备应用程序.该系统用传统的USB总线取代了RS232串行总线,通过对
敏捷制造作为一种新的制造战略,能快速整合多个企业的优势资源、极大地增强企业的应变能力,被认为是21世纪制造业的发展战略。虚拟企业(也称动态联盟)是实现敏捷制造的重要手段和
该论文研究的是在复杂背景彩色图像中竖直正面人脸的检测问题,从基于样本统计的算法框架出发,提出了彩色图像分割和支持向量机(SVM)相结合的正面人脸检测算法.在彩色图像分割
该文首先概述温室的发展过程及国内外温室的发展状况,介绍了温室控制系统结构及其主要功能,对温室相关信息有了全面认识.针对该文的主要内容:温室气候控制策略的研究,查阅了
本课题是国家自然基金项目――纳米晶金刚石薄膜场发射阵列阴极研究的一部分。根据场发射的特性,研究其特性参数的测量,以及根据测量结果计算出各参数间的关系式。根据要求,设计
发酵工业在国民生活和国民经济中的作用越来越重要,这一工业领域的操作管理和自动化控制成为很重要的课题。但由于发酵过程动态是高度的非线性和时变性、模型不确定性、关键变
该文主要是介绍1394/VXI总线0糟控制器模件的研制.该文以继承与创新相结合为指导,立足已有的MXI/VXI、PCI/VXI总线控制器模件研制工作,在充分消化和吸收国内外已有的VXI总线
随着成像技术、计算机技术、网络技术和存储技术的快速发展,图像处理方面的研究也越来越得到学者们的重视。图像因其能传递丰富内涵信息,成为信息的重要载体。场景图像内容的合
无线传感器网络作为一种新的信息获取和处理技术,具有广阔的应用前景。但由于储能技术的限制和应用领域的特殊性,无线传感器网络在能量上是高度受限的,这使得高效地使用节点能量
该论文在实际需求的牵引下,有目标地综合各种先进理论,努力解决一些现实问题.根据研究所的总体研究工作部署,作者先后参加了两个领域的工作:智能交通系统(ITS)研发和医学影像