基于自监督网络的DDPG算法的建筑能耗控制

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:wangxin3163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对强化学习方法训练能耗控制系统时所存在奖赏稀疏的问题,将一种基于自监督网络的深度确定策略梯度(deep deterministic policy gradient,DDPG)方法应用到建筑能耗控制问题中.首先,处理状态和动作变量作为自监督网络前向模型的输入,预测下一个状态特征向量,同时将预测误差作为好奇心设计内部奖赏,以解决奖赏稀疏问题.然后,采用数据驱动的方法训练建筑能耗模型,构建天气数据作为输入、能耗数据作为输出.最后,利用基于自监督网络的DDPG方法求解最优控制策略,并以此设定空气处理装置(air handling unit,AHU)的最优排放温度,减少设备能耗.实验结果表明,该方法能够在保持建筑环境舒适的基础上,实现较好的节能效果.
其他文献
当前车辆识别大多采用深度学习方法,直接输入图像数据进行训练以获得车辆分类的深度网络,由于图像本身存在透视形变及尺度变化,因此不得不采取大量不同类型数据进行训练,同时也无法获取车辆相关的物理信息.为了改进上述问题,本文提出基于逆投影空间训练的车辆细粒度识别方法.首先利用标定信息及几何约束,对单目投影下的车辆构建精细化的三维包络框.然后将车辆三维包络展开,获得规范化及标准化的逆投影空间数据.最后利用深度卷积网络对这些展开的规范数据进行训练分类及回归,获得5种常见车辆细分类结果及对应的物理尺寸信息.实验结果表明
当今科研活动已越来越依赖科研数据网络的高效传输,这对科研专网的链路资源规划和运行管理带来了更高要求.面向科研专网的实际需求建立链路流量预测模型能使网络运营者在SDN等先进控制转发技术辅助下更有效进行资源调度的快速决策.现有的预测方法未考虑当前网络流量更具多样化和更高复杂度的深层细粒度特征.通过改进LSTM模型,本文面向科研专网的管理需求提出了一种新型的链路流量预测模型,由自编码器AE、双向LSTM模型、单向LSTM模型和全连接层组成的AE-栈式混合LSTM模型,较大幅度提升了流量特征的提取能力,更好地挖掘
省域范围房产交易与登记大数据可视化呈现的建模分析预测对于研究我国城乡建设、区划经济的布局趋势,呈现城镇建设发展指标的时空演化,辅助支持科学决策、宏观调控等具有重要意义.考虑到这些经济活动数据的预测建模涉及到尚无明确数学表达的、因素作用复杂的事物状态演变过程,受近代人工智能深度神经网络技术在类似复杂场景成功应用的启发,我们采用相关的长短时记忆网络模型(LSTM)与全连接层(FC)技术等AI技术,建立起宏观可视化的省域房产大数据热力图预测系统.本文的主要系统建设实践是,利用所获的广东省域(东沙群岛除外)历年积
在公安部推行“放管服”改革新举措后,为了解决广大车主针对机动车年检提出的审车难、审车贵、审车拥堵、审车没时间等问题,设计出一套车辆检测服务平台.本文重点研究并实现了车辆检测服务平台的业务流程、平台功能结构,其中通过小程序的方式与车主互动,通过物联网技术识别车辆检测状态信息,通过移动APP引入司机和检测站员工参与,通过服务平台整合车主、司机、检测站等多方参与.测试结果显示,该系统集成测试及性能测试结果较好,可以满足实际应用需求.上线试用表明,该车辆检测服务平台一定程度上可以解决车主审车难、检测站分布不均等实
随着深度学习在目标检测领域的大规模应用,目标检测技术的精度和速度得到迅速提高,已被广泛应用于行人检测、人脸检测、文字检测、交通标志及信号灯检测和遥感图像检测等领域.本文在基于调研国内外相关文献的基础上对目标检测方法进行了综述.首先介绍了目标检测领域的研究现状以及对目标检测算法进行检验的数据集和性能指标.对两类不同架构的目标检测算法,基于区域建议的双阶段目标检测算法和基于回归分析的单阶段目标检测算法的一些典型算法的流程架构、性能效果、优缺点进行了详细的阐述,还补充了一些近几年来新出现的目标检测算法,并列出了
针对隧道施工过程中沉降量精准预测问题,提出了一种基于时空特征区域神经网络的施工隧道沉降量预测方法.依据当前隧道地表下沉量,通过有效融合多维空间特征量,对未来的演化趋势做出合理预测.以白家庄隧道栾川端的地表观测数据为例,对所提方法的预测性能进行算例分析.结果表明:所提预测方法对隧道地表沉降量数据均有较准确的预测效果,且预测结果也具有一定的鲁棒性.研究可应用于实际隧道施工的监测管理过程.
针对Ceph存储系统面对小文件存储时存在元数据服务器性能瓶颈、文件读取效率低等问题.本文从小文件之间固有的数据关联性出发,通过轻量级模式匹配算法,提取出关联特征并以此为依据对小文件进行合并,提高了合并文件之间的合理性,并在文件读取时将同一合并文件内的小文件存入客户端缓存来提高缓存读取命中率,经过实验验证本文的方案有效的提高了小文件的访问效率.
本文主要研究了在室内场景中使用多台无人机设备对受害者进行合作搜索的问题.在室内场景中,依赖全球定位系统获取受害者位置信息可能是不可靠的.为此,本文提出一种基于多智能体强化学习(MARL)方案,该方案着重对无人机团队辅助救援时的路径规划问题进行研究.相比于传统方案,所提方案在大型室内救援场景中更具优势,例如部署多台救援无人机、救援多位受害者.本方案也考虑了无人机的充电问题,保证无人机的电量始终充足.具体地,鉴于模型中的救援场景深度参数不断变化,所提方案将搜索路径规划问题模拟为部分可观的马尔可夫决策过程(De
当前针对非结构化数据处理的研究多集中于实验态的技术实现,对于其在金融投研业务中落地应用的整体架构与路径的研讨则较为缺乏.为此,提出将大数据、自然语言处理、知识图谱等技术结合起来进行智能化投研平台的研发设计,并实现其在真实金融投研场景的应用.该平台基于Hadoop分布式系统进行数据采集、存储与计算,集成了传统文本处理技术及主流AI算法,形成了投研相关的深度语义理解能力,一是高效提取出金融文本信息,并以知识图谱的形式存储;二是基此进一步挖掘预测,输出金融投研领域的智能化分析服务.以金融研究中城投债相关文本作为
作为主要传动零部件,汽车发动机连杆质量直接影响发动机的传动性能,最终影响着整车的安全性.针对同时实现汽车发动机连杆几何参数、弯曲、扭曲检测问题,提出基于机器视觉的发动机连杆质量多参数检测.构建汽车发动机连杆质量多参数检测视觉系统,研究基于多阈值分析与同态滤波的图像预处理,去除发动机连杆图像中的阴影、增强图像对比度.基于亚像素级分析与Hough变换检测发动机连杆图像的直线、圆等几何特征目标,采用最小二乘法拟合发动机连杆几何特征参数,并分析质量参数,实现汽车发动机连杆质量多参数检测.某车用发动机连杆质量多参数