论文部分内容阅读
自“9·11”事件后,恐怖组织,例如“伊斯兰国”,“基地”组织,塔利班等屡屡在世界各地策划和组织恐怖袭击。在我国,“东突厥”等恐怖势力也屡屡在新疆,西藏,昆明等地发动袭击,对人民生命财产安全造成了巨大的威胁。为了遏制恐怖袭击,各国都加大了在反恐安全方面的投入。但是在实际操作中,如何高效的分配安全资源对于恐怖分子的潜在攻击目标进行保护,最小化恐怖分子的攻击影响,成为了当前亟待解决的问题。基于博弈论的安全资源分配机制为该问题提供了一个理论框架和数学模型,目前相关领域已经有许多理论研究,一些基于这些理论的系统已被开发并实际运用多年,它们为安防部门打击恐怖犯罪做出了巨大的贡献。但是,反恐安全领域仍然面临着许多挑战,近年来安全机构例如FBI等,由于黑客等原因,屡屡爆出机密信息遭到泄露的问题,例如“斯诺登案”等,安防部门需要在安防资源调度的策划阶段就考虑信息泄露带来的威胁,然而现有工作并没有考虑这些。针对这一问题,本文提出了一种考虑了信息泄露的恐怖分子阴谋检测模型TPDIL(TPD games with the considering of Information Leakage),TPDIL建立了相关模型以及定义了安防部门在这种情况下的收益。通过最大化安防部门的最小最大收益来计算博弈的强Stackelberg解。但是,因为博弈双方的策略空间均是指数级的增长速度,这使得直接求解的规模十分有限。为了解决这个问题,本文提出了一种基于double oracle框架的求解方法DO-TPDIL(an Double Oracle algorithm for TPDIL),提出了多项式级别的方法来加速运算过程,只有在快速方法无法找到策略时,才根据精确算法进行计算,避免复杂耗时的运算过程。模拟实验显示,本文提出的DO-TPDIL算法可以有效地计算防守方监控策略。在运行时间方面,相比直接求解的方法,DO-TPDIL算法可以有效地提升求解问题的规模。而在算法表现方面,通过和几种基准线策略进行对比,DO-TPDIL算法计算出的防守方监控策略是最优的,并且随着恐怖分子规模的增大而保持稳定的收益。实验结果显示,本文同样讨论了不同的泄露场景和参数对于防守方收益的影响。