基于增强学习的充电站选择策略研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:tmsyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于石油价格的不断攀升以及汽车排放污染物带来的严重环保问题,使得节能减排成为全球的新课题,为电动汽车发展迎来了最佳时机。未来城市交通将以电动汽车为主,无论是混合动力汽车还是纯电动汽车都需要公用充电设施外插电源充电。然而,随着电动汽车规模化发展,大量电动汽车在充电时的无序充电将会对电网、充电设施和用户产生不可忽视的影响,电动汽车如何快速高效充电有着重要的研究意义和实用价值。本文在电动汽车,基于实时运行的场景中,研究如何同时避免驾驶员在充电路程中耗时过长与充电站“部分爆满部分闲置”的情况出现。本文将设计基于Dijkstra、SARSA、Q-learning、DQN算法的充电汽车实时充电决策方法,并针对城市环境的复杂多样性,提出的电动汽车实时充电场景,将城市整体划分为B*V个网格,其中每个网格代表城市的一个城市区域。在场景中加入全局控制器(Global Controller,GC)和RSU,使车辆运行并更快速准确地进行实时充电选择。本文的主要工作在于:(1)实现车辆实时充电选择,同时从微观角度与宏观角度两方面优化车辆和充电站,并且利用V2V(Vehicle to Vehicle)通信方式使车辆高效准确获取并传输信息。(2)与现有的调度工作不同,本文在调度过程中考虑了城市环境的高维度组成部分,其中包括不同的空间、时间,得到的最优解为最优时空路径。(3)逐步提出基于Dijkstra最短路径算法、Q-learning算法、SARSA算法、以及DQN算法的具体决策方法来解决文本提出的问题以及相关因素比较,并实现基于场景的算法运算,得到Dijksta算法下的车辆行驶路径,得到Q-learning算法、SARSA算法下的训练结果表(Q-table值)、DQN算法的loss值,并根据结果表计算车辆下一节点选择并最终确定车辆行驶路径,得出最优路径。结合ONE仿真平台上仿真,得到同一环境下四种算法的结果,设计三种评价指标进行比较,并最终得出在车辆实时充电场景下,增强学习将大大优化于最短路径算法。而在复杂情况极高的实际环境中,DQN也将成为最具优势算法。
其他文献
LiTaO_3是一种典型的多功能材料,因其独特的电学性质而应用于滤波器和探测器等电子器件中。介电性能对电子器件的小型化、轻量化和集成化有重要影响,是滤波器和探测器的重要性能之一。然而,近些年来,对LiTaO_3单晶材料的研究比较丰富,对其作为陶瓷材料的制备、微观缺陷及其介电等性能的报道还较少。本文分别采用无压烧结和热压烧结制得添加MnO_2的LiTaO_3基陶瓷材料,探究烧结方法、无压烧结温度、热
山西省生态扶贫实践是习近平生态扶贫观的区域践行,取得了良好的实践效果,受到习近平总书记和中央的高度认可。生态扶贫的山西样本主要包括两种类型:以生态建设为驱动的融合
面对复杂多变、竞争激烈的经济环境,企业需要及时调整战略以适应经营环境的快速变化,CEO作为企业领导者在这个过程中发挥着核心作用。在经济全球化的背景下,CEO作为一种解决董事会决策效率低下的机制被引入我国,负责领导企业的战略变革活动并扮演着重要角色。近年来我国CEO变更事件有增无减,“CEO变更对企业战略变革的影响”成为学界和业界共同的热议话题。在上述背景下,文章从继任CEO视角出发,以高阶梯队理论
随着我国国家宏观政策和邮轮旅游市场高质量发展双向推动,邮轮制造产业取得巨大成果。为了形成邮轮制造业优势产业链,缩短制造周期,降低投资风险,由此涉及众多企业参与合作,但是在有限理性条件下各企业追求自身利益最大化,相互合作的同时存在着供应链之间的相互竞争,进而导致合作链断裂、合作失败等恶性连锁反应。为了促进我国邮轮制造业供应链长期稳定协调发展,邮轮制造商需和外部供应商加强合作和协调,迫切需要建立完善的
近年来,无人驾驶成为了人们耳熟能详的词汇,无人驾驶的研究最早可追溯到上世纪中期,随着技术的发展,二十一世纪之后逐渐走入了大众的视野,近年来,更是迎来了广阔的发展,无人驾驶的落地也成为了各个研究单位竞相实现的目标。自动驾驶中,环境感知的稳定性是保证车辆正常行驶安全的前提之一。为了测试研发过程中设计算法的可行性和稳定性,需要进行大量的场景测试过程。但实际场景测试的高成本和针对特殊驾驶时刻而测试的高危险
在党中央强调高校加强思想政治教育工作的大背景下,高校思想政治教育越来越受到重视。当前高校中的思政课教师与辅导员为提升思政教育育人效果而尽自己最大努力,取得了不错的效果,高校学生的思想政治素养有所提升。但是另一方面,也发现了一些问题,高校学生思想政治教育效果依然些许不尽人意,其中一个重要原因就是高校辅导员与思政课教师在育人过程中,仍处于“各自为战”的阶段。虽然取得一定效果,但是并没有使学生达到真正的
随着中国制造业的发展,自动化设备在制造业内大量应用,压缩空气作为重要的二次能源,其应用范围日益扩大。本文将LCD面板工厂的空压机控制系统作为研究对象,重点研究了空压机的工艺流程及控制策略,结合厂内已有设备设计了一套优化控制方案,旨在提高空压机系统稳定性,减少电能浪费。通过对空压机原理及LCD工厂压缩空气供应流程、使用场景进行详细分析,发现工厂空压机系统存在供应压力波动大、能源浪费的问题。为了解决上
特征选择是数据降维的方法之一,在机器学习中具有去除数据集冗余特征,降低计算时间开销的作用。过滤式特征选择是特征选择方法中的一种,传统的过滤式特征选择方法注重于选出有利于分类器分类的特征,却缺乏对安全问题的考虑。近几年的研究表明,传统过滤式特征选择方法选出特征后,已选特征的数据子集提供给分类器使用时,攻击者能轻易地逃避分类器的检测。为解决此问题,目前现有方法FAFS对此提出了对抗过滤式特征选择模型,
创意文化产业是当前我国重点发展的产业集群,并已经纳入“十三五”规划之中,预计2020年创意文化产业GDP贡献比例将达到5.0%,成为我国新的经济支柱型产业。创意文化产业作为一种新的战略性新兴产业,具有高技术、高附加值和高融合性的特点。发展创意文化产业不仅可以创造新的经济增长点,还可以有效的促进产融结合以及结构的优化。目前黑龙江省正处于经济发展方式由粗放型向节约型的转变,由重点发展重工业向轻工业倾斜
随着大数据技术的不断发展,数据共享变得更为普遍,共享的数据量也随之剧增。大数据共享和交易的普及,在给工作和生活带来便利的同时,不可避免地给大数据的版权保护带来了新的调整,比如数据库在上下级分发和售卖后可能存在二次分发和二次售卖的情况。因此如何在数据库泄露后,实现其版权保护并追溯泄露源成为信息安全研究的一个重点问题。鲁棒数据库水印作为一种行之有效的大数据版权保护技术,得到了广泛研究,但该技术不可避免