基于Policy Gradient算法的PoW挖矿困境研究

来源 :计算机应用 | 被引量 : 0次 | 上传用户:clgg1976
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对区块链中工作量证明共识机制(Proof of Work,PoW)下区块截留攻击导致的挖矿困境问题,将矿池间的博弈行为视作迭代的囚徒困境模型(Iterative Prisoner’s Dilemma,IPD),采用深度强化学习的策略梯度(policy gradient)算法研究IPD的策略选择。利用该算法将每个矿池视为独立的智能体(agent),将矿工的潜入率量化为强化学习中的行为分布,通过policy gradient中的策略网络对agent的行为进行预测和优化,最大化矿工的人均收益,并通过模拟实验验证了policy gradient算法的有效性。实验发现,前期矿池处于相互攻击状态,平均收益小于1,出现了纳什均衡的问题;经过policy gradient算法的自我调整后,矿池由相互攻击转变为相互合作,双方的潜入率趋于0,人均收益趋于1。结果表明,policy gradient算法可以解决挖矿困境的纳什均衡问题,最大化矿池人均收益。
其他文献
本文介绍了国内外城市生活垃圾的产生及处理现状 ,分析了各种技术的优缺点 ,指出了我国城市生活垃圾处理存在的问题 ,并提出了相应的对策
中医对糖尿病的辨证分型较为主观 ,证型分类也较复杂。对 1 994~ 2 0 0 2年的 70余篇相关文献和我院的病历进行调研 ,发现文献报道与我院中医专家对糖尿病的辨证分型基本相似
概述了酶抑制法快速检测蔬菜中有机磷和氨基甲酸酯类农药残留技术的研究现状、检测原理、应用情况和存在的问题。酶抑制法具有检测时间短、成本低、操作简便等特点,是目前我
一些人认为动物们长相很萌,也没有建立什么复杂的社会关系,看上去不会耍什么心机。真实情况是为了争取异性,会使旁门左道的动物也不少。
目的探讨口腔癌患者血清生存素和黏着斑激酶(FAK)的表达及与其临床病理参数的相关性。方法收集口腔癌患者62例,同期纳入体检者50例为对照组。比较口腔癌组和对照组血清生存素
当归补血汤是补气生血的代表方,方中选用大量黄芪配少量当归以补气生血,且黄芪当归的比例为5:1。结合当归补血汤所致疾病的病理机制为血虚发热、补气选黄芪的原因以及对当归
目的探讨全程护理干预减少全麻手术患者留置尿管并发症的效果。方法对照组采用《基础护理学》标准留置尿管常规护理;实验组实施全程护理干预,包括:术前针对性宣教、麻醉后无
该文系统概括了中国菊花发展历史和中国菊花走向世界的历程;从起源、品种类群、育种研究、栽培技术等方面详细介绍了当今中国菊花研究的概况。
我国近年来取得的经济上的发展成就,道路与桥梁建设等基础建设工程做出了巨大贡献。但是,在道路与桥梁建设为人民群众的出行提供便利、为经济发展提供保障的同时,其施工安全