基于变学习率的多agent学习算法的研究

来源 :长春工程学院学报(自然科学版) | 被引量 : 0次 | 上传用户:xiansong2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对在动态学习的环境中的IGA算法做了研究,改进了梯度方向上的步长恒定不变的不足,引入了变学习率,并介绍了调节学习率的方法——WoLF原则,加速其收敛。最后根据该方法,对Q学习算法做了改进,并通过仿真试验证明了算法的有效性。
其他文献
介绍了国内外汽车机油的现状及发展趋势,指出中国研发高级别润滑油的紧迫性。为了达到高级别润滑油的性能要求,合理选择基础油和添加剂,在均匀设计的基础上安排多因素试验,对试验
为了提高综采工作面液压支架喷雾的降尘效率,通过分析影响支架喷雾降尘效率的因素,以支架喷雾效率最高为优化目标,利用量子遗传算法对喷嘴到产尘点距离,雾化角度,喷雾压力,喷嘴个数
剖宫产中取头困难是产科医师无法避免的难题,胎头深嵌取头困难,术中易出现新生儿窒息和产伤、子宫下段裂伤及产后大出血等,严重者危及母婴性命,也是导致医疗纠纷的常见原因。剖宫
防提安全装置是起下钻杆中防止误操作的安全设备,但长时间未对其进行结构改进,且其在应用过程中存在操作不规范情况,从而在油田钻井过程中引起诸多问题,甚至导致一系列严重事故的
从地质雷达的基本原理出发,结合沙坝一号隧道DK22+267~DK22+292段软塑状黏土溶洞的探测实例,总结了双曲线波、阶梯状复合波、强反射波以及复合波条带区域等软塑状黏土溶洞的雷
由于单一传感器在石油罐区安全监控中容易受到外界因素影响从而产生误差,为提高传感器检测结果的可靠性和罐区安全监控预警的准确性,基于多源数据融合技术,建立罐区安全状态
保障证人出庭质证是审判中心诉讼制度改革的重要一环。现行《刑事诉讼法》对证人出庭制度做了重大改革完善,但细微观之却仍然存在不足:证人概念未区分"审前作证"与"庭审质证"
本文系巴拉吉尼玛,额尔敦巴雅尔二位同志与阿沛·阿旺晋美同志就蒙藏关系及蒙藏文化等问题进行谈话的记录整理,经阿沛·阿旺晋美同志同意在本刊发表。
中共中央办公厅、国务院办公厅近日印发《生态环境损害赔偿制度改革方案》(以下简称《方案》)。2018年1月1日起,生态环境损害赔偿制度将在全国试行。17日,环保部相关负责人就《方
会议
中国高校教育与教学的改革一直在不断探索与深化,从学年制到学年学分制,进而到完全学分制,作为一种新的高校教育管理模式,完全学分制在各高校的推广过程中取得了较大的成果,