基于边界样本协调的多智能体合作学习

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:bigdoglsm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对Q学习状态空间非常大,导致收敛速度非常慢的问题,给出一种基于边界样本协调的多智能体在线合作学习方法,使得智能体在特定的子空间上进行特化并通过边界状态上的开关函数相互协调,从而能够较快地学习到局部最优.仿真实验表明该方法能够取得比全局学习更好的在线学习性能. Aiming at the problem that the learning space of Q is very large and the convergence speed is very slow, a collaborative multi-agent collaborative learning method based on the coordination of boundary samples is proposed, which enables the agent to specialize in a particular subspace and pass the boundary state Which can be used to learn local optimum quickly.Experimental results show that the proposed method can achieve better online learning performance than global learning.
其他文献
改革开放以来,随着产业结构的优化调整,各行业对专业技术型人才的需求量与日俱增。作为培养技术型人才的高职院校在国家相关政策以及巨大市场需求的促进下,再次找到了进一步发展
本文分析了高校学生社团管理存在的问题和产生原因,以坚持社团自主管理、加强高校引导、重在规范原则和可操作原则,试图从领导机制、监督机制、考核评价机制、激励机制等方面入
乡村旅游是一种综合运用农村文化资源的旅游产品。发挥文化在乡村旅游发展中的主题定位、内涵深化、产品包装、特色优化等功能,能有力推进农村休闲文化产业发展,打造出特色鲜
二次系统仿真是集控站仿真的重要方面。通过与调度员培训仿真(DTS)系统中保护仿真的对比,分析了集控站二次系统仿真的特殊性。在原有DTS系统基础上进行了二次系统仿真的扩展
通过在不同的环境湿度、冷却时间和烘干时间对玻璃纤维滤筒进行称重实验,得出滤筒称量受实验室环境湿度、冷却时间、烘干时间等因素的影响,会呈现正误差的结论.引入空白标准
针对大尺度图像配准和不同传感器图像配准问题,介绍了一种基于SIFT的图像配准方法。首先提取图像中适应尺度变化的不变特征点,在提取过程中加入多尺度Harris检测算子,提高了匹配点对的重复率,通过聚类和归一化互信息准则对候选匹配点对的角度、尺度和位置特征进行迭代筛选,删除错误的匹配点对,最后得到正确的匹配点对,对图像进行配准。实验结果表明:该方法能处理相似变换的图像配准。
介绍了存在背景干扰和噪声情况下的红外图像中弱小目标的检测问题,提出一种基于Contourlet变换的检测算法。首先对图像进行Contourlet变换,利用Contourlet分解后子图像的特性
文章论述了在经济社会快速发展的形势下,进一步加强企业思想政治工作的必要性.
结合案例介绍了车库在住宅小区规划实施的方式,提出了车库在住宅小区规划实施时需注意的几个方面,对车库在住宅小区规划实施提供一些借鉴.
为了解决变电压处理器上以延长电池使用时间为目标的任务调度问题,提出一种基于控制步的电池感知任务调度算法.实验结果表明: 在电池感知优化最有效率的范围内, 该算法跟传统