基于生成对抗网络的强化学习方法及其在建筑节能方面的应用

来源 :苏州科技大学 | 被引量 : 0次 | 上传用户:fazaizhaoyun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国城市的迅速发展,大型公共建筑的数量不断增加,建筑高能耗问题日益突显,因此建筑节能成为当前建筑智能领域的一项研究重点。能耗预测是能耗优化的重要前提,通过对能耗预测结果进行分析,可以为建筑节能提供依据。大型公共建筑是一个复杂的非线性系统,这使得能耗预测变得困难,而且能耗预测需要采集大量不同状态的能耗样本,但是样本的采集成本较高。强化学习是一种能够在与环境的交互中采集样本的学习方法,通过与环境交互获得样本,学习从环境到动作的映射,最终目标是最大化累积奖赏,并获得最优策略,其主要优点在于自学习。本文围绕如何利用强化学习方法对建筑能耗预测展开研究,通过生成对抗网络生成与历史能耗相似的样本以解决真实能耗样本不足的问题,然后将强化学习中Q学习算法用于建筑能耗预测。同时,为了提高算法性能以及能耗预测准确率,引入深度学习与值函数近似方法,构建深度Q网络。本文主要内容包括以下三部分:(1)针对将强化学习应用于能耗预测中存在真实能耗样本不足的问题,首先提出一种基于生成对抗网络的强化学习算法。该算法在训练初期通过随机策略收集经验样本以构成真实样本池,并利用所收集的经验样本训练生成对抗网络,然后利用生成对抗网络生成新的样本构成虚拟样本池,再结合真实样本池以及虚拟样本池共同选择训练样本。最后,将该算法应用于OpenAI Gym仿真平台中的强化学习问题,实验结果表明,该算法可以有效解决强化学习任务初期经验样本不足的问题。(2)将第一部分所提出的算法应用于建筑能耗预测,提出一种基于生成对抗网络的Q学习能耗预测算法。该算法将能耗预测问题建模为时间序列预测问题,然后结合Q学习算法,预测未来时刻建筑能耗。同时,引入生成对抗网络,结合真实样本,生成新的建筑能耗样本,以解决建筑能耗样本不足的问题。最后,基于美国巴尔的摩燃气和电力公司的建筑能耗数据,将所提出的算法进行实验分析,实验结果表明,所提出的算法可以有效地预测未来时刻建筑能耗。(3)针对将Q学习算法应用于非线性能耗预测性能较低的问题,提出一种基于生成对抗网络的深度Q学习能耗预测算法。该算法引入深度神经网络,构建深度Q网络计算动作值函数,输入为状态,输出为每个动作的动作值函数,用值函数近似方法来避免Q学习在大状态空间中,算法性能较差,甚至无法收敛的问题。实验结果表明,所提出的算法可以进一步提高建筑能耗预测准确率。
其他文献
目的研究经支气管镜联合各项微创介入技术治疗结核性中央型气道瘢痕闭塞实现再通的有效性及安全性。方法回顾性分析24例结核性中央型气道瘢痕闭塞患者经气道介入集群技术,观
<正>《统计研究》是中国统计学会主办的学术刊物,国内外公开发行。自1984年创刊以来,在广大作者、读者的关心支持下,逐渐形成了自己的办刊特色,成为统计领域最具权威性和影响
本文给出了降雪及铲雪机工作的基本模型 .对于两种铲雪机类型 ,分别建立了铲雪机位置的微分方程和铲雪次数时间序列的递归公式 .讨论了铲雪次数时间序列的若干性质 ,得到了两
为了提高干线公路穿越城镇路段的行车安全性,探究车辆在干线公路穿越城镇路段上的行驶特性,通过实地调研车辆的速度、加速度及驾驶员操作次数的变化的相关数据,以交通工程学
打造企业核心竞争力的根本在于盘活人,麦当劳的核心竞争点在于人,而全面管理思想的精髓也在于此。"感动执行"作为一种柔性执行理念将助推全面管理的运行。本文提出用基于"感
本研究基于钴、镍的过渡金属特性,将其氢氧化物电化学原位修饰于碳糊电极表面。利用过渡金属与农药中的氮、硫等原子的配位作用,实现了将修饰电极的固相微萃取及电催化特性应
时代发展,社会进步,农村经济发展的速度越来越快,农村居民对金融服务的需求也越来越高,传统的金融供给模式早已不能满足。资金缺口问题已经成为我国农村地区近期建设和社会发
随着课程改革的深入,精准教学的理念广泛渗透在教学中。实施精准教学,教师应基于课程标准、教材和学情,设计精准、高效的教案,使课堂教学各环节相互渗透、相互配合。以PEP五
二维纳米材料因尺寸效应而具有独特的物理性质,从而在多个领域具有广泛的应用前景,其中,二维材料在实现单光子发射领域具有极大的研究价值。实现具有确定性和高度不可分辨性
为探讨3种盐生植物对碳离子束和电子束的辐照敏感性以及适宜辐照剂量,本研究采用不同剂量、能量和剂量率的碳离子束和不同剂量的电子束对盐角草(Salicornia europaea L.)、野