基于博弈论与强化学习的新能源汽车产业政策研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:hudanrong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国务院在《2030年前碳达峰行动方案》[1],明确指出要推动运输工具装备低碳转型,大力推广新能源汽车,加快绿色交通基础设施建设,降低全生命周期能耗和碳排放。近年来,中国政府为促进中国新能源车市场的发展,出台了一系列刺激政策:包括新能源车补贴政策,双积分政策,充电桩基础设施补贴等。然而,我国的新能源车市场发展还是面临着诸多的隐患:例如新能源车补贴对于政府的负担过重,双积分政策[2]在制定初期偏于保守,公共充电桩基础设施发展严重滞后。支持新能源汽车产业发展的政策问题仍待解决。在实现“碳达峰碳中和”目标的背景下,针对新能源汽车产业的政策研究依然具备重要的理论意义和学术价值。目前新能源汽车产业政策研究主要以多阶段博弈理论为主,然而阶段博弈方法研究存在较大的局限性,本论文在阶段博弈理论的基础上,加入了微分博弈理论,系统地总结了一套基于微分博弈的决策优化框架,使用该框架中的数值迭代方法和启发式方法(深度强化学习)均能够有效的求解微分博弈模型下的最优决策。在此基础上,本论文使用阶段博弈理论,模拟了汽车制造商与消费者博弈,分析并预测了双积分政策改革和新能源汽车补贴退坡的影响。使用微分博弈理论模拟了政府、新能源车制造商及充电桩运营商的三方动态Stackelberg博弈,优化了双积分政策和充电桩基础设施补贴,有效协调了新能源汽车和充电桩基础设施的发展,解决了充电桩基础设施发展相对滞后的问题。本文的主要研究内容和相应的结论如下:(1)在双积分政策改革和新能源汽车补贴退坡的背景下,基于多阶段博弈方法,模拟了汽车制造商与消费者博弈,分析了2020-2021年双积分政策改革和新能源补贴退坡的影响,预测了2022年汽车市场,证明了“双积分”政策对新能源汽车市场发展和双碳目标达成的促进作用。(2)提出了基于微分博弈的决策优化框架,使用该框架中的数值迭代方法和启发式方法(深度强化学习)能够优化复杂微分博弈下的参与人决策。(3)考虑到充电桩基础设施的发展相对滞后,为有效协调新能源汽车和充电桩基础设施的发展,基于微分博弈方法模拟了政府、新能源车制造商及充电桩运营商的三方动态Stackelberg博弈,使用文中的微分博弈决策优化框架求解了2022-2035年政府角度下的最优双积分政策和充电桩基础设施补贴,并证明了优化结果的有效性。
其他文献
虽然我国经济逐渐转入高质量的发展,但是我国空气污染仍然很严重,而空气质量的好坏直接影响着我国居民的生活质量。因此对于空气质量数据的预测和分析可以给气象部门进行气质预报以及环保部门进行空气质量评估和管理提供参考,这十分具有现实意义。本文所选的五座城市(武汉、北京、上海、长沙、西安)位于中国的东西南北中五个方位,不仅是所属区域的核心城市,也避免了模型只在部分数据集上预测精度较高的偶然性。本文利用爬虫技
学位
新修改的《行政处罚法》增加了关于应受行政处罚行为主观要件的规定,但仅从语义理解的角度来看,主观要件是否为必须要件仍不明确。理解新增的主观要件条款,应当结合修法背景,对应受行政处罚行为的主观要件进行体系化研究。化解修法过程中关于应受行政处罚行为是否必须包含主观要件之争议的方法是建立统一的认知框架。建立统一的认知框架包括明确应受行政处罚行为的概念和主观要件的性质。应受行政处罚行为中的行政处罚是一种减益
学位
与传统给药方式相比,采用肺部干粉吸入的方式递送纳米药物治疗肺癌具有靶向性好、药物生物利用度高、毒副作用低等诸多优势。然而,常规干粉吸入纳米制剂肺部递送效率低下和肿瘤组织深层穿透能力不足的问题极大的限制了其药效的发挥。基于这样的现实问题,本课题开发了一种具有两级粒径可变特性的纳米粒-载体复合物吸入微球。复合物微球可以通过两次连续的粒径变化依次克服上述两个难题,从而有效提高抗肿瘤药效。首先以透明质酸纳
学位
优化问题是科研领域和工业界中常见的问题,广泛存在于许多实际应用中,如物流调度、决策等。优化领域将优化方法分为确定性优化和启发式智能优化。不同于确定性方法求解优化问题易陷入局部最优,智能优化算法(如进化算法等)具有更好的全局优化性能。多任务智能优化是智能优化领域的一个新兴课题,相较于传统智能优化一次只优化一个任务,多任务智能优化可同时高效地处理多个优化任务。各任务在优化在线进行的同时互相传递有用的知
学位
中非“三网一化”合作,即铁路、公路和航空网络以及基础设施工业化合作,是中国推动构建全球交通命运共同体,为全球交通治理提供中国智慧和中国方案的重要行动。然而在评估中国发展合作的影响时,出现了“债务陷阱”、“安全威胁”、“干涉内政”等肆意抹黑。埃塞俄比亚是中非合作的典范,本文选择埃塞俄比亚作为案例研究对象。本文提出国家能力建设的经验扩散是中埃交通基础设施发展合作的重要特点,分析了合作中经验扩散的具体路
学位
在乡村老龄化现实情况与乡村振兴战略背景下,乡村地区建设受到国家和社会的高度关注。近年来老龄办发布的《关于开展示范性全国老年友好型社区创建工作的通知》和《全国示范性老年友好型社区评分细则(试行)》标志着社区改造逐步从城市老旧社区向乡村延伸,引导有条件的乡村社区以老年友好为目标进行人居环境更新。乡村社区公共空间作为老年人重要活动场所,不仅可以提供休闲锻炼、信息交流以及情感支持和社会帮助,还能让村民在良
学位
由于金属镁丰富的地壳储量、较高的理论体积比容量和较高的安全性能等优势,可充镁电池是非常有潜力的新型储能电池。但是,镁负极存在几个问题限制了可充镁电池发的发展:表面极易生成一层绝缘钝化膜、镁枝晶生长引发安全问题和镁易发生腐蚀问题。为了解决这个问题,本文采用在Mg-HMDS基非亲核电解液中加入添加剂的策略对镁负极界面结构进行调控,有效提高了镁负极和全电池的电化学性能,阐述了添加剂对镁负极界面结构调控的
学位
二氧化氮(NO2)是一种具有挥发性和强刺激性的有毒气体,大量存在于自然环境和工业生产中,是造成酸雨、雾霾、光化学烟雾等环境问题的主要原因,从而对人类生命健康和公共环境安全造成了威胁。因此,对环境中NO2浓度的监测对人类生活具有重大意义。氧化锌(Zn O)是一种金属氧化物半导体(MOS),基于Zn O材料的气体传感器具有高灵敏度、制备简单、合成成本低等优点,但存在工作温度高、选择性差等问题。而利用纳
学位
为降低渣-金反应程度,近年来,不含SiO2的低反应性BaO-CaO-Al2O3-TiO2-Li2O五元系,成为高钛钢连铸的一种潜在新渣系。在熔体网络结构中,Al2O3和TiO2作为两性氧化物,既能作为网络形成体,也能作为网络修饰体,但组分的变化对二者两性行为的影响规律及作用机制却少有研究。此外,在硅酸盐体系中BaO对熔渣结构具有双重作用,但BaO对铝钛酸盐熔体微观结构及宏观特性的影响尚不明确。因此
学位
“邻避”现象是现代化和都市化加速发展的伴生物。中国城镇化高速发展的大背景下,城市边界也逐渐向外拓展,随着时间的推移,原先在郊区的公共设施不断迁移靠近城市中心。同时,已有的城市基础设施难以保障城市正常运转,需要大规模选址建设新的基础设施。这些设施产生了噪音、环境污染等诸多不良影响,降低周边住宅的环境品质,进而产生邻避效应。随着住宅产业发展和人民生活水平提高,住房需求已从“住有所居”向“住有优居”转变
学位