基于深度学习和强化学习的供热系统控制策略优化

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:mwd2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会城镇化进程的不断发展,人们的生活水平也在不断提升,保持冬季室内温度的稳定舒适非常重要。而集中供热系统作为现代城市公共事业的重要基础设施,能够在冬季寒冷气候下为城市提供稳定可靠的高品质热源,改善人民生活,并且环保安全,价廉方便,具有显著的社会效益和经济效益。换热站作为连接热源厂热水和热用户暖气片等室内供热设施的中间节点,能够把热源厂的初始水温进行升降调控成合适温度后送给热用户。所以在不同的天气下如何调控供热水温,每次升降多少十分重要,并且针对不同建筑结构的小区,调控策略也应该与之适配。但是传统的气候补偿器控制策略存在模型简单、调节粗放、气候补偿曲线固定不变、不能及时获得室内温度反馈、无法通过预测提前控制等缺点,难以保证不同气候变化的情况下室内温度的稳定舒适。基于此,本文研究基于深度学习和强化学习的供热系统控制策略优化方法,主要工作包括以下几个方面:1.在天津市多个小区数百所业主家中部署安装实时温度传感器,平均每个小区各收集到了一整个供暖季三分之一房屋的室内温度真实数据。然后收集小区室外气象监测站监测到的同一个供暖季的气象数据和室外温度数据。并且从换热站取到同一个供暖季二次侧管网供热温度数据。对这些数据进行整合、清洗等,再以热力学定律为基础分析数据影响关系,并生成建模所需基础数据集。2.提出了一种深度多时差分网络MTDN,可以在原始数据量较少的情况下,充分挖掘数据集内的隐藏信息,同时可以根据实际需要对模型Loss进行专有设计,使其具备较高的预测精度和泛化能力。该网络以真值数据集作为输入,以多时差分数据集作为标签,基于热力学第一定律,以学习室内温度的热力学特性为目标,使得模型在保持预测精度的同时,结果也符合物理规律。并且通过实验验证了该网络具备稳定的预测效果以及对于房屋热力学特性较好的模拟效果,使其可以充当真实房屋环境的模拟器以及强化学习模型与之交互的环境。3.针对集中式供暖系统实际场景,将基于最大熵强化学习思想的SAC算法包装成策略优化器用于供热系统控制策略优化,因为最大熵因素的引入,使得其具备强大的探索能力,能够学到稳定的供热策略。针对室内温度实时舒适度引入表征人体热舒适度的专用评价指标PMV作为模拟器奖励项,针对室内温度长期稳定性以多个时刻室内温度方差作为模拟器另一奖励项,并对这两个奖励项进行加权求和,整合成模拟器整体奖励,使得策略优化器所学策略可以更好地满足实际场景。最后设计了相关实验,证明了该策略优化器所学的策略能够保证室内温度的长期稳定舒适。
其他文献
随着我国铁路运输的发展,铁路运输不能仅达到单纯运输的目的,还要兼顾轻量化、低噪声、保护环境等等,为了实现该目的,研发新型结构转向架成为关键。现阶段我国铁道车辆转向架一般采用轴箱在车轮外侧布置的二轴或者多轴转向架,它具有蛇行运动稳定性好,抗侧滚能力强,检修方便等优点,因此成为了我国铁道车辆的主型转向架,但是它也存在着由于簧下质量大,造成轮轨作用力及轮轨磨耗增大,小半径曲线及扭曲线路通过性能差等缺点,
学位
智能功率集成电路在生活中的应用越来越广泛。电机驱动芯片是智能功率集成电路的一个重要领域,广泛应用于生活中的工业、汽车、消费电子等领域。目前芯片的供应受当前国际化环境的影响巨大。因此研究、设计电机驱动芯片有着重要的意义。A4950是美国知名芯片企业的一款电机驱动芯片,主要用于驱动有刷直流电机。此电机驱动芯片能够工作在8V~40V的电源电压下,持续输出3.5A的电流,最大静态电流为10μA。能够根据外
强激光束在科学和军事领域有着巨大的应用前景。很多情况下,强激光束的获得和使用,都将会与超音速流场有关。当强激光束通过超音速流场时,会受到流场的干扰,而且流场参数也会由于强激光束的辐射加热产生变化。对超音速流场与强激光的相互作用机理研究越来越受到关注。 本文作为国家自然科学基金项目《强激光与超音速自由剪切层的相互作用》的机理研究工作,采用NND-2M差分格式,数值求解了二维全N-S方程,得到了
在核电压水堆一回路系统中,主管道是将堆芯中核燃料产生的热能通过循环水传递到二回路的核一级安全部件。主管道的主要作用是通过工作介质完成能量的传递,并把介质的大部分动能转化为压能。主管道用奥氏体不锈钢易在高温、高压和放射性等恶劣服役环境下产生热老化脆化效应,导致其断裂韧性下降,从而使得反应堆运行风险大大增加。因此,开展热老化对主管道不锈钢断裂行为的影响规律研究,将为主管道的安全设计和可靠性评定提供技术
水是所有生物生存所需要的重要资源,是生态环境循环变化的重要控制因素。运用各种手段监测和量化陆地水的变化对当地政府以及国家进行干旱与洪涝的预防、水资源管理政策的制定以及气候变化分析等都有重大意义。局部Slepian函数是将局部区域内的地球物理信号转化为空间谱的一种方法,该方法可以保证在球面上局部范围内获得最优谱平滑解,非常适用于局部范围地球物理信号的研究。本文目标是应用Slepian函数方法解算60
在5G时代背景下,来源于社交媒体的大数据凭借快速反应、自发反馈、获取成本低等优势成为城市灾害应急管理中新的数据源,在灾害分析和促进城市安全方面所发挥的作用被赋予了新的意义。特别是在应对COVID-19大流行时,社交媒体大数据在舆情监测、疫情预警、传染源追踪等方面发挥了特殊的作用。然而,社交媒体大数据海量、多模态特点突出,有效信息难以挖掘。因此,及时、准确、高效的文本分类成为社交媒体大数据应用中亟需
非光滑系统的动力学研究是当代科学技术领域的重要课题,干摩擦是一种典型的非光滑因素,它会导致复杂的动力学问题。同时几何非线性是一种普遍存在于实际工程应用中的非线性问题。干摩擦和几何非线性共同存在的实际问题同样也广泛存在,比如弓弦乐器和航母战斗机拦截系统等。由于干摩擦的存在,这些系统都有可能出现粘滞滑移振动。但目前对摩擦系统的研究更多的是针对轨迹穿越切换面的情况,且更偏向于数值计算。由于干摩擦的特殊性
高分辨率遥感影像具有丰富的地物形状、纹理等细节信息,从中获取到的地物分类信息可以广泛应用于农业、环境和灾害等诸多方面。然而,影像分辨率的提高增大了场景复杂度、数据量和类内差异,这使得传统的严重依赖人工设计的特征并且不考虑高级语义信息的遥感影像分类方法不能快速准确地从高分辨率遥感影像中获取地物分类信息。因此,有必要研究适用于高分辨率遥感影像的快速准确分类方法。深度学习技术能准确、高效地提取图像的深层
密集人群聚集,如果管理不当或突发意外事件,可能因人群拥挤而造成重大安全事故。因此,竞争性密集人员出口流率研究是竞争群集运动学的热点之一。本文搭建长8米×宽4米×高2米的房间并在其里面开展系列实验。通过改变人员竞争性、出口大小、出口位置探索不同竞争强度下的流率。文中通过提取记录行人的时间间隔、总疏散时间等参数进行对比分析。首先通过控制出口宽度探索了不同竞争性下人群的疏散特征,实验组织54名志愿者开展