囚徒困境问题相关硕士博士期刊学术论文

“囚徒困境”问题是非合作博弈中的一类经典问题。从1950年Tucker将此类问题正式命名至今，历经了整整半个世纪。其间大量学者采用实......

学位

Q－learning是一种优良的强化学习算法。该文首先阐述了Q－learning的基本学习机制，然后以囚徒困境问题为背景，分析、对比了Q－learning算......

期刊

在博弈问题中很多学习机制只能使Agent收敛到Nash均衡解,不能很好地满足实际需要。将博弈问题转化为多目标优化问题,提出了一种新......

期刊

本文给出了求解多人非合作有限纯策略纳什均衡的一个简单的方法,从而可使一些具有典型的经济背景的二人非合作对策问题——譬如囚......

会议

非合作对策纳什均衡囚徒困境问题