基于局部合作的RoboCup多智能体Q-学习

来源 :计算机工程 | 被引量 : 0次 | 上传用户:hzjojo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多智能体Q-学习中存在的联合动作指数级增长问题,采用-种局部合作的Q-学习方法,在智能体之间有协作时才考察联合动作,否则只进行简单的个体智能体的Q-学习,从而减少学习时所要考察的状态-动作对值。在机器人足球仿真2D平台上进行的实验表明,该方法比常用多智能体强化学习技术具有更高的效率。
其他文献
目的:本研究旨在通过观察不同类型冠心病患者发病后血小板活化程度及其差异性,结合患者冠状动脉造影结果所报告的冠脉狭窄程度(通过计算Gensini评分评估狭窄程度),初步探讨冠心病患者血小板活化水平与冠状动脉狭窄严重程度之间的关系,了解血小板活化与冠心病之间的相关性。方法:收集在2018年3月至2018年12月之间发病并首次于陕西省人民医院心血管内科就诊的患者,在排除存在其它显著影响血小板活化的相关因
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
针对P2P网络中出现的free-rider现象,提出一种控制点位于服务提供节点上的平衡机制。该机制充分考虑P2P网络拓扑结构不一致的问题,并允许一定数量的free-rider节点存在。实验证
本研究立足中国统筹城乡发展的大背景,对中国农村金融制度的演进历程进行梳理,并运用绩效评价手段进行考察,以期为中国农村金融制度的发展寻找方向。主要内容包括:(1)通过参考
针对基于局部特征匹配的图像配准和识别算法对于多谱段图像配准性能较差的缺点,提出一种基于局部特征聚类匹配的图像配准方法,该方法针对多谱图像的特点构建优化的局部特征提取算子,根据特征点对的相对主方向统计信息对初始匹配点集重新聚类,求出正确匹配的点对子集以实现配准。实验结果表明,该算法较大地提高了多谱图像配准的正确率和精度。
本文从区位风险的角度,分析了中国制造业企业在对外投资中面临的风险。具体来说,本文根据风险因素的来源,把区位风险分成政治风险、社会与文化风险和经济风险三个纬度,并通过
设计一种基于无线传感器网络目标跟踪的移动Agent路由算法OSER。基于传感节点对目标信息的感知强度和节点的剩余能量确定Agent的目标跟踪路径,在有效相邻节点问建立局部网路拓
D-S证据合成规则在遇到冲突证据时常有悖常理。针对现有规则的不足,通过理论分析和对几种常用组合规则的比较,提出一种基于近邻思想的冲突证据修正规则,综合考虑证据源的有效
产业转移作为产业结构调整的主要手段,它是一个十分复杂的经济现象。在转移的过程中涉及转出地和承接地的资源禀赋、交通运输、政府政策、金融环境等等的因素。产业转移的过
本文首先论述了犯罪动机的一般理论;其次通过介绍国外的立法规定和司法实践,认为国外的相关经验可以为我国刑事立法采用,最后,对犯罪动机立法化进行思考,分析了立法化的必要