基于连续空间深度强化学习的插电式混合动力公交能量管理策略研究

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:ychhome
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
插电式混合动力汽车以其节能减排方面的优势成受到行业关注。本文以插电式同轴混联公交为研究对象,重点关注基于连续空间深度强化学习的插电式混合动力公交的能量管理策略。分析同轴双电机动力系统的工作模式,根据整车参数以及动力性需求完成动力系统各部件参数匹配。采用搭建后向仿真方式搭建插电式混合动力公交模型,通过硬件在环与实车道路采集获取工况数据。建立了基于DP(动态规划)的能量管理策略,实现离散空间能量管理全局最优;构建基于Q-learning的能量管理策略,使能量管理策略可以在离散空间中自主学习逼近全局最优;分析基于DP与Q-learning在离散化过程导致精度误差与维度灾难使策略,表明离散空间的能量管理难以兼顾有效性与实时性;分析以神经网络为代表的参数化能量管理策略,研究了连续空间中的求解方法,分析现有连续空间能量管理策略受到训练数据的制约。基于Q-learning与神经网络的能量管理策略为基于AC能量管理奠定了理论基础。基于深度强化学习框架AC(Actor-Critic)的插电式混合动力系统的能量管理策略为本文的研究重点。基于AC的能量管理策略利用两个深层神经网络,一个直接输出连续控制信号被称为“表演者”网络;另一个评估“表演者”网络控制策略长期收益被称为“评价者”网络。“表演者”网络与“评论家”网络根据强化学习算法在连续空间中自主学习,AC通过历史经验数据更新网络参数最终得到能量管理策略。在仿真环境下试验了基于AC能量管理策略的性能,试验结果表明,AC在不同驾驶工况下在节能减排方面表现优异,AC的经济性指标在CTUDC,WVUCITY和WVUSUB工况下相较于离散空间全局最优的能量管理策略-动态规划提升了5.5%,2.9%和9.5%,而且消耗更少的计算资源。在随后试验中证明了AC无需离散化的优势使能量管理策略从根本上避免离散化误差和维度灾难。此外,通过两个试验验证了AC对不同工况的鲁棒性以及实际工况的适应性,试验结果表明基于AC的能量管理策略在插电式混合动力汽车,特别是单次行程相对固定混动公交的应用场景中具有潜力。
其他文献
数据同化起源于气象学,是一种将各种不同来源的观测信息融入模拟自然界的数值模型的数据融合算法。以往的数据同化系统的研究与实现是基于特定模型或者特定方法的,开发实施耗
随着社会的发展和全球化的不断深入,教育在社会发展中发挥着越来越重要的作用,也逐渐成为国家核心竞争力的重要组成部分。随着中西方在教育理念、培养模式以及科研成果等方面
蜂窝系统中的D2D(device-to-device)通信被视为5G关键技术之一。在D2D通信过程中,D2D用户(DUE)通过复用蜂窝用户(CUE)的频谱资源进行直接通信,这种方式通信距离短、频带利用
随着相继出台的国家政策不断推动工程咨询行业转型升级,全过程工程咨询模式日益普及。这一模式的出现促进着项目管理模式的转变,咨询单位介入项目组织后,形成了跨组织控制、项目控制与专业人士控制三者耦合作用的多层控制结构,即业主方对咨询方的跨组织控制、业主方与咨询方共同组成的项目管理团队对工程项目的项目控制、以及咨询方控制其企业内部成员的专业人士控制。三层控制耦合在一起共同提升项目履约绩效,因此,全过程工程
延迟容忍网络(Delay Tolerant Network,简称DTN)近年来受到广泛的研究,在DTN中不存在端到端的持续连接,节点通常采用“存储—携带—转发”的方式进行数据传递。随着智能手机
随着计算机图像处理技术的发展,数字图像取证问题受到了特别关注。为了对自然图像与计算机生成图像进行来源取证,研究者们提出了许多方法用于鉴别自然图像和计算机生成图像。
近年来,移动Ad Hoc网络凭借其自组织性、无中心性等网络特点,得到了越来越多的广泛应用。但是,由于移动场景的复杂性和网络拓扑结构的动态变化,很容易造成网络拥塞,使得移动
随着信息技术水平不断提高,视频资源已经成为我国中学课堂中教师常用的教学资源,学生获得信息的渠道愈加广泛,自我意识不断提高,动机层次不断增强,教师和学生的认知方式以及师生关系也随之发生改变。教师面临前所未有的挑战。教师只有不断的丰富知识储备,提高教学技能技巧,才能应对挑战。合理应用教学资源可以减轻教师工作压力,提高教学效率,改变学生学习怠倦现象,提高学生学习兴趣,活跃课堂气氛,提高整体教学水平。初中
房地产行业作为支柱性产业,对我国经济的影响举足轻重。近年来房地产开发企业发展面临的宏观经济环境、政策环境以及行业环境都发生了巨大的变化,楼市起伏波动较多,房企的资本运营面临较大压力。本文试图了解在起伏跌宕的市场环境中,房地产企业的资本运营受到了怎样的影响?为此,在梳理了楼市波动对房企资本运营的影响机制的基础上,本文选择31家A股上市房地产开发企业作为研究对象,选取其2007年—2018年的财务数据
本翻译实践报告基于笔者参与的《罗斯福传》(Franklin.D.Roosevelt)一书英译汉的翻译实践完成。该书深刻解读了罗斯福的非凡卓越人生,作者通过大量详实的历史数据,详尽描述了