基于Policy Gradient算法的PoW挖矿困境研究

来源 :计算机应用 | 被引量 : 0次 | 上传用户：clgg1976

【摘要】

：

针对区块链中工作量证明共识机制(Proof of Work,PoW)下区块截留攻击导致的挖矿困境问题,将矿池间的博弈行为视作迭代的囚徒困境模型(Iterative Prisoner’s Dilemma,IPD),采

【作者】

：

王甜甜于双元徐保民

【机构】

：

北京交通大学计算机与信息技术学院;

【出处】

：

计算机应用

【发表日期】

：

0年期

【关键词】

：

区块链工作量证明机制博弈论深度强化学习策略梯度算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对区块链中工作量证明共识机制(Proof of Work,PoW)下区块截留攻击导致的挖矿困境问题,将矿池间的博弈行为视作迭代的囚徒困境模型(Iterative Prisoner’s Dilemma,IPD),采用深度强化学习的策略梯度(policy gradient)算法研究IPD的策略选择。利用该算法将每个矿池视为独立的智能体(agent),将矿工的潜入率量化为强化学习中的行为分布,通过policy gradient中的策略网络对agent的行为进行预测和优化,最大化矿工的人均收益,并通过模拟实验验证了policy gradient算法的有效性。实验发现,前期矿池处于相互攻击状态,平均收益小于1,出现了纳什均衡的问题;经过policy gradient算法的自我调整后,矿池由相互攻击转变为相互合作,双方的潜入率趋于0,人均收益趋于1。结果表明,policy gradient算法可以解决挖矿困境的纳什均衡问题,最大化矿池人均收益。

其他文献

城市生活垃圾的绿色处理方略

本文介绍了国内外城市生活垃圾的产生及处理现状 ,分析了各种技术的优缺点 ,指出了我国城市生活垃圾处理存在的问题 ,并提出了相应的对策

期刊

城市生活垃圾无害化资源化减量化

糖尿病的中医辨证分型及中药治疗

中医对糖尿病的辨证分型较为主观 ,证型分类也较复杂。对 1 994～ 2 0 0 2年的 70余篇相关文献和我院的病历进行调研 ,发现文献报道与我院中医专家对糖尿病的辨证分型基本相似

期刊

糖尿病中医辨证分型中药治疗

酶抑制法快速检测蔬菜中有机磷和氨基甲酸酯类农药残留的研究现状及展望

概述了酶抑制法快速检测蔬菜中有机磷和氨基甲酸酯类农药残留技术的研究现状、检测原理、应用情况和存在的问题。酶抑制法具有检测时间短、成本低、操作简便等特点,是目前我

期刊