机器学习在多Agent系统控制决策中的应用研究

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:xmblyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文对机器学习算法在多Agent系统控制决策中的应用进行了研究:针对多Agent系统中普遍使用的有施教者的学习算法,提出基于范例的学习方法,该方法独立于特定的学习算法之上,主要解决训练数据的获取问题;针对有施教者的学习算法中训练数据的噪声的问题,提出了基于聚类的训练数据预处理算法,通过对训练数据完成两次聚类处理,有效地消除噪声数据,从而提高学习算法的学习效率;为了更有效的提高多Agent系统的稳定性,本文还提出了多Agent系统中的潜在角色值方法,通过改进多Agent系统的角色模型,从根本上避免了由于可能出现的Agent之间的频繁角色转化而造成的系统效率损失及系统不稳定性。实现了Agent自学习。 机器学习算法根据是否有施教者可以分为三大类:有施教者的学习,无施教者的学习和增强学习。其中,有施教者的学习算法在多Agent系统中应用最为普遍,比如人工神经网络算法和决策树算法等。由于学习算法本身的工作机理,他们都需要依靠训练数据来实现学习器的泛化。本文提出的基于范例的学习方法主要解决的就是训练数据的获取问题,该方法独立于特定的学习算法之上,利用多Agent系统的可观测性,在线积累原始数据,然后进行集中离线泛化,从而实现了在线、离线相混合的学习。 除了训练数据的获取,几乎所有有施教者的学习算法都面临的另一个问题就是训练数据的噪声问题。数据中噪声的产生有多种原因。虽然许多学习算法都有鲁棒性和较强的容错性,噪声的存在可能不会影响最终的学习效果,但会影响算法的收敛速度。而对于那些容错性较差的算法,噪声数据的存在则会直接影响学习效果。本文提出的基于聚类的训练数据预处理算法能够在多项式时间内对训练数据完成两次聚类处理,通过可控参数的调整,有效地消除噪声数据,
其他文献
自由飞行空间机器人FFSR(Free-FlyingSpaceRobot),又叫机器人卫星RS(RobotSatellite)或空间机械臂(SpaceManipulator),由卫星本体和其上搭载的机械臂组成。自由飞行空间机器人
随着Web服务及相关技术的迅速发展,企业业务集成逐步过渡到面向服务的体系结构之上。如何基于面向服务的体系结构集成分布、自治的Web服务,成为目前迫切需要解决的问题。动态
数据库技术的广泛应用对时态信息的管理提出了挑战。到目前为止,许多研究者在关系数据模型的基础上提出了种种时态关系数据模型,但是由于关系模型本身的限制使得这些模型在实
信息技术的飞速发展,以及商业化的大力推广,使得嵌入式系统深入到我们的日常生活和工作中。对于大多数嵌入式系统来说,它的核心是嵌入式实时操作系统。目前,市面上可供用户使用的
智能机器人是一个对外界环境高度开放的智能系统,由一系列具有独立问题求解能力的子系统组合而成。机器人各子系统在自主地完成各自的子问题求解的同时,在黑板的干预下互相协
经过近十年来的发展,工作流技术已经日渐成熟,并在许多领域成功应用。但是,随着企业的全球化和Internet 的迅速发展,业务过程逐渐延伸到了企业之外,多个合作伙伴参与的协作的
嵌入式操作系统是高端嵌入式系统的一个重要组成部分,其应用越来越广,尤其在功能复杂、系统庞大的应用中显得更为重要。随着嵌入式系统应用的不断深入,支持多平台已成为嵌入
本文论述了基于概率的上下文无关语法的句法分析的原理及实现过程。本文首先回顾了自然语言的发展历史和应用范围,同时介绍了句法分析在自然语言中的重要的地位和本文的主要
IPSec协议是一系列基于IP网络,由IETF正式定制的开放性IP安全标准,是虚拟专网的基础。IPSec可以保证局域网、专用或公用的广域网及Internet上信息传输的安全,能在IP层上对数
随着移动通信技术完成从2G向2.5G的过渡和3G时代的到来,当今移动通信设备的功能日益强大,应用领域已经从单纯的电话业务扩展到视频和音频(AV)、位置相关的服务(GPS)、语音识别