论文部分内容阅读
广义纳什均衡问题,简称GNEP,是非合作博弈论中一类重要问题.与经典的纳什均衡问题相比,最大的不同在于每一个参与者的策略集都依赖于其他参与者的决策.广义纳什均衡问题之所以备受关注,是由于其在经济学、数学和工程学等方面的广泛应用,涵盖了无线电通信、结构工程学、计算机科学以及污染处理等课题.如此广泛的应用使得其潜在的重要性不容小觑,然而,对广义纳什均衡问题数值算法的研究还很欠缺. 当考虑到更一般形式的广义纳什均衡问题时,现有的可证明收敛性的数值算法大多适用于求解一些特殊的问题,见参考文献[32].近年来,一些学者提出了利用惩罚技巧来求解广义纳什均衡问题,这为GNEP的研究开辟了一条新的路径.其中,文献[10,11]给出了简单易行的惩罚框架和罚参数更新准则,从而保证算法收敛到广义纳什均衡问题的解.但是其收敛性分析建立在某种约束品性上,而且从数值计算角度来看子问题的不可微性也是棘手的;另外一点值得考虑的是用何种方法来求解子问题.一个很自然的想法就是如何扬长避短,并将广义纳什均衡问题的求解付诸于实践. 本文主要提出了一种新的罚算法来求解一般的广义纳什均衡问题.我们利用内点惩罚框架来定义罚参数的更新准则,即利用非线性规划中的惩罚技巧来消去问题中某些复杂的约束,将广义纳什均衡问题转化为带有简单约束的经典纳什均衡问题.接着,根据纳什均衡问题相对应的变分不等式形式,利用交替方向法这一有效工具来进行求解.在一定的条件下,我们证明了新算法的全局收敛性.多个数值例子的实验结果表明算法是有效的.