论文部分内容阅读
针对在Robocup中型四人组机器人足球比赛中,原有的投票机制在进行角色分配时产生的系统震荡问题和系统反应不灵敏问题,提出用动态权值的投票机制进行解决。由于投票函数的设定有很大的人为因素,而强化学习在与环境的交互时的试错可能给系统带来风险损失,因此把动态权值的投票机制与Q学习相结合应用于角色分配。通过仿真验证了方法的有效性。