囚徒困境问题相关论文
“囚徒困境”问题是非合作博弈中的一类经典问题。从1950年Tucker将此类问题正式命名至今,历经了整整半个世纪。其间大量学者采用实......
Q-learning是一种优良的强化学习算法。该文首先阐述了Q-learning的基本学习机制,然后以囚徒困境问题为背景,分析、对比了Q-learning算......
在博弈问题中很多学习机制只能使Agent收敛到Nash均衡解,不能很好地满足实际需要。将博弈问题转化为多目标优化问题,提出了一种新......
本文给出了求解多人非合作有限纯策略纳什均衡的一个简单的方法,从而可使一些具有典型的经济背景的二人非合作对策问题——譬如囚......