元对策相关论文
在MDP中,单Agent可以通过强化学习来寻找问题的最优解.但在多Agent系统中,MDP模型不再适用.同样极小极大Q算法只能解决采用零和对策模型的MAS学习问题.文中采......
发展不平衡性是我国的国情。地区差异是我们制订政治、经济发展和改革战略必须正视的问题。本期刊登了项东方等同志撰写的《二元......
在MDP,单Agent可以通过强化学习来寻找问题的最优解。但在多Agent系统中,MDP模型不再适用。同样极小极大Q算法只能解决采用零和对策模型的MAS学习问题。文......