多智能体系统的学习策略研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:mountaineer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习是一种无监督学习方法,它能够使智能体在环境模型未知的情况下利用环境奖赏发现最优的行为序列,因此被广泛用于多智能体系统中(如RoboCup足球仿真系统)。目前主流的强化学习算法是Q学习算法,Q学习算法的应用能够大大改善系统的性能,但Q学习也存在不如人意的地方。本论文针对Q学习算法的学习速度慢这一问题进行了深入的探讨,提出结合启发知识函数的Q学习算法,改进了标准Q学习算法的效果。本文主要内容如下: 首先,简要介绍了本课题的研究内容、目的意义、国内外发展状况和研究方法等,针对机器学习是人工智能领域研究的热点,及在多智能体系统的广泛应用。对比分析了机器学习的各种学习策略,阐述了它们的基本原理、结构、分类和适合应用的系统环境。结合RoboCup仿真系统的特点,我们最终选择强化学习作为改善我们球队协作策略的主要算法。然后,论文阐述了强化学习理论的原理、组成要素和分类。对比分析了强化学习四种算法的学习原理、结构特点和适用对象。基于我们仿真球队的实际情况,横向比较了几种强化学习应用于球队协作策略的效果,选择以Q学习算法为本文的主要改进算法。 其次,针对标准Q学习算法学习速度慢的缺点,本文提出一种基于启发知识的改进型Q学习算法,该算法在标准的Q学习算法中加入具有启发知识的函数来影响学习过程中智能体动作选择,从而加快了智能体在复杂环境中的学习速度。然后,提出了一种具有启发知识的并行Q学习算法,在该算法中,参与学习的各智能体独立的执行基于启发知识的Q学习算法的同时,智能体通过交流学习成果、融合启发知识、共享学习结果,提高整个多智能体系统的学习效率。 最后,论文利用Matlab仿真验证了启发式Q学习算法的有效性并给出了两个实例。实例中的智能体能够通过学习快速的选择动作,其学习速度和决策判断的准确度比标准Q学习算法都有明显的提高。我们将启发式Q学习算法应用于RoboCup仿真球队中,并与应用了标准Q学习算法的球队进行比赛。结果显示,启发式Q学习算法的球队队员协作能力远远强于标准Q学习算法的球队。相比较于标准的Q学习算法,智能体通过启发式Q学习可以更快的学习到正确的动作决策,从而有效的提高了智能体的学习速度,对仿真球队高层协作策略的有效执行有很大的帮助,提高了球队的综合水平。
其他文献
在城市夜景建设中进行户外音乐灯光表演将使城市充满活力,给人以美的享受。目前的户外音乐灯光表演中普遍运用了舞台灯光控制技术,虽然沿用成熟的技术会使系统构建简单,易于
陀螺稳定跟踪平台已成为现代军事装备中海、陆、空、天武器系统不可缺少的装备,在预警、火控、反潜、瞄准、警戒和侦查等多方面发挥着重要的作用。为了使平台的跟踪精度达到要
视频运动对象分割是数字视频处理和计算机视觉的重要研究领域之一,同时也是智能视频监控等关键应用中的核心技术。虽然人们已经做了大量研究工作,但目前还没有一种通用的方法
光学字符识别(Optical Character Recognition,OCR)是机器视觉领域一个重要的研究方向。随着当前社会中生产生活的各个方面自动化程度越来越高,字符识别技术在复杂场景尤其是
本文将H∞回路成形设计方法应用于具有弱阻尼模态的卫星姿态控制系统设计中,设计出了控制器并对闭环系统进行了仿真分析,仿真结果表明,用H∞回路成形设计方法设计出的控制器
目前,很多厂矿企业车间使用的天车往往是多台配合使用,起吊大型设备。一直以来,因天车碰撞发生的安全事故给国民生产生活造成了巨大损失。传统的解决方案难以有效解决这一难题,本
迭代学习控制(Iterative Learning Control,简称ILC)是近二十年发展起来的一种新的智能控制方法。迭代学习控制就是根据工业过程的某种重复特性,利用系统先前的控制经验和输
近年来,我国国民经济快速发展,拉动了钢铁产品的需求,也带动了与钢铁生产相关的配套产品的需求。其中轧钢轧辊的市场需求十分旺盛,同时也对轧辊的品种、质量和交货期提出了更高的
对间歇生产过程进行监控的目的在于及时有效发现生产过程的非正常情况、保证生产安全、提高产品质量的一致性和降低生产成本。与连续生产过程相比,间歇生产过程特性更加复杂,数据具有多阶段、非线性、动态、多批次等特性,对其进行过程监控更加困难。间歇过程统计性能监控由于不需要过程精确的解析模型,所获得理论成果和方法能够较快的应用于实际工业生产过程中,因此被广泛研究,已成为过程控制领域的研究热点之一。本文在深入研
当今,分布式人工智能研究的一个热点是多智能体系统,它是分布式问题求解的进一步发展。随着多智能体理论与技术的发展,其应用范围也在不断扩大,但是多智能体技术的理论与应用