基于深度强化学习的热泵供热系统节能控制

来源 :建筑科学 | 被引量 : 0次 | 上传用户:huojugjf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
热泵供热系统广泛应用于住宅建筑,其优化控制对于提高需求侧的能源效率至关重要。基于模型的控制方法需要精确的建筑模型,而无模型控制方法前期效果较差,收敛速度较慢。针对这些问题,提出了1种基于Deep Q-Learning及其改进算法的强化学习方法。该方法具有较快收敛速度,能够根据不同建筑环境自适应学习建模,在热舒适收益和能耗成本之间寻找平衡。北京市某近零能耗住宅建筑实际验证结果表明,该算法与基准策略相比综合收益提高15.3%。
其他文献
<正>2014年9月,智利北部阿塔卡马沙漠高原上新建成的阿塔卡马毫米/亚毫米波阵列(Atacama Large Millimeter/submillimeter Array,ALMA)进行了仪器测试,开展了持续的天文观测项目.ALMA是用干涉方法进行天文观测的射电天线阵,由66个天线构成,总长度达到16km.ALMA是一个国际合作建设的天文工程,由来自欧洲、北美和东亚等的各国(地区)合作运行.天文
期刊
为提高磷酸掺杂率,增强膜在高温低湿下的质子传导率,同时保证其机械性能,将季铵化八氨苯基笼型聚倍半硅氧烷(QOAPS)与溴甲基化聚芳醚酮和季铵化试剂三甲胺共混,得到含有QOAPS的季铵盐型聚芳醚酮铸膜液,并用流延法制备成膜,再以浸渍方式掺杂磷酸,获得功能化POSS/磷酸共掺杂型聚芳醚酮高温质子交换膜(PA-QPAEK@QOAPS)。通过对不同QOAPS掺杂量的质子交换膜的磷酸掺杂量、尺寸稳定性、机械
随着我国经济的不断增长和科技化创新型产业的不断升级,制造业的生产规模越来越大,复杂性越来越高,人们的需求越来越多样化,日新月异的变化促使制造业朝向智能化自动化的方向发展。生产调度一直是智能制造业中一个非常活跃的领域,它被定义为一个优化过程,在各种制造活动之间分配有限的制造资源,实现生产成本、资源浪费的有效降低以及生产周期的缩短,以期提高企业竞争力,保障企业最大效益。置换流水车间调度问题(permu
助读系统是语文教材的重要组成部分,主要包括单元提示、预习、旁批、注释、阅读提示、读读写写、插图等具有助读性质的材料。统编本语文教材作为在全国范围内统一使用的新版教材,其助读系统的编制更加灵活全面,蕴含着丰富的教学资源。统编本教材不仅是学生学习的教科书,也是教师用来教学的参考书。然而,在具体的教学实践中,只有少数教师可以应用助读系统作为备课讲课的方向与资料,多数教师未能看到助读系统的作用与价值,从而
<正>在国有企业的发展过程中,员工的思想素质、职业态度、业务能力以及价值观念等因素有重要的影响力。为了确保国企稳定而快速地发展,基层工会作为国企的重要组成部分,应该肩负起培训员工的责任和义务,对如何做好员工的职业培训进行全面而深刻的分析,确定科学合理的培训方案,促进职工群众和企业共同进步。
期刊
公共建筑空调室温调控过程具有强烈的非线性特征,难以建立其精确数学模型,并以此为依据实施在线控制。在实际应用中,工程技术人员只能借助经验完成控制器参数整定工作,费时费力且难以达到预期的效果。为此,以变风量空调系统为研究对象,本文提出了1种基于物理-数据驱动混合模型的自整定控制方法,进一步开展传统基于经验的串级PI方法与提出自整定方法的对比试验研究。结果表明,在无人参与的条件下,该方法能够实现空调末端
目的 探索剪切波弹性成像技术(SWE)在甲状腺相关眼病(TAO)的诊断及活动性分期中的应用价值。方法 选取TAO患者32例,其中活动期18例,非活动期14例,健康对照组30例。常规超声测量眼直肌厚度及球后脂肪深度,SWE测量眼直肌及球后脂肪杨氏模量平均值(Emean),比较各组上述参数的差异。结果 TAO组较对照组、活动期组较非活动期组的4条眼直肌厚度和球后脂肪深度均明显增加(P<0.05)。TA
在企业经济的快速发展中,无论是我国内部还是整个世界来看,工人阶级和资本家都存在着或多或少的阶级矛盾,为了减少工人和企业之间的矛盾,推动企业稳定健康发展,一般来说每个企业都会成立专门的工会组织,当二者之间存在冲突时由工会组织进行协调与管理,同时还可以为企业发展与决策提供支撑。通过笔者对工会组织的研究发现,现阶段工会组织对于企业的发展起着较大的推进作用,但依然有大部分企业的工会组织并不能吸引员工,使得
本研究设置气候室模拟夏季人员在室外通勤及进入建筑内部过程中各阶段的热环境,通过实验研究在建筑过渡空间设置风扇对人员热状态及工作效率恢复的影响。结果显示,在过渡空间通过开启风扇维持环境0.8 m/s的空气流速,人员在过渡空间停留5 min后的热感觉由未开启风扇时的1.89(热)降至0.82(稍热);另外,后续静坐阶段,在各类型空调末端环境中,受试者的热感觉在6 min内恢复至中性,工作效率在15 m