基于机器学习的建筑空调能耗数据挖掘和模式识别

来源 :北京交通大学 | 被引量 : 5次 | 上传用户:taohappy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代,建筑运行数据量越来越大且维度越来越高,使用传统技术对这些数据集进行分析是耗时且不现实的。采用机器学习算法对数据进行分析处理并挖掘其价值是目前国内外最新的趋势。本文以中国石油大厦为例,研究了基于机器学习的建筑空调能耗数据挖掘和模式识别。利用时间序列符号化工具SAX和无监督机器学习算法Kmeans,对大厦2017年的空调能耗数据进行了降维聚类分析和模式识别,主要结论和创新成果如下:(1)建立了基于SAX符号化处理、机器学习聚类分析和模式识别的建筑能耗数据分类方法体系。首先进行数据预处理,通过SAX符号化和降维处理得到365组结构化数据和13种粗类能耗模式;然后,根据建筑分时流向图,观察类簇个数,再进行Kmeans聚类处理,得到5条聚类曲线和5种能耗模式;最后,进行模型验证和模式识别。该体系对逐时空调负荷预测和设备故障检测诊断具有指导意义。(2)探讨了建筑空调能耗数据的聚类方法及参数选取。首先,通过分析数据特征和聚类算法实现难度及准确度,选取合适的聚类方法,即Kmeans算法;然后,分析数据的数据结构,选取距离计算函数;再通过轮廓系数,分6种情况讨论并得出了类簇个数K的值;最后,通过聚类系谱图验证了 K值的合理性。(3)对中石油大厦空调系统全年90%的运行时间的能耗数据进行了聚类分析,得到5条能耗曲线(或5级聚类模型),分别对应5个能耗等级。五级模式、四级模式、三级模式、二级模式和一级模式分别对应100-80%、80-60%、60-40%、40-20%和20-0%的实际空调负荷下制冷设备的运行模式。(4)从暖通工艺角度,分模式分时段讨论了五条能耗曲线的物理意义。结合分时电价和逐时空调负荷,分析了不同供冷模式下,3台双工况主机的制冷工况和制冰工况、2台基载主机制冷工况、蓄冰装置的融冰工况及三者的组合情况;明确了五级能耗模式的实际意义。并分别按季节、月份、周细分三个维度对比分析这5种能耗模式,验证了能耗分级的合理性。(5)验证了五级聚类模型正确性。根据机器学习模型验证规则,训练数据集和测试数据集各占总能耗数据的50%,分别用相应模式的测试集来评估聚类模型的泛化能力,得出模型置信度为95.45%。进行初步模式识别,效果良好。
其他文献
肩周炎全称为肩关节周围炎,以肩部弥漫性疼痛与肩关节活动障碍为主要特征,是多发生于中老年人的慢性肩部疾患,其病变范围可涉及到肩关节周围肌肉、肌腱、筋膜、韧带、滑膜囊
建设境外经贸合作区是我国政府支持有条件的企业扩大对外投资的重要举措。通过国家的统筹指导,由国内企业在境外建设或参与建设的基础设施较为完善,辐射和带动能力强的经济贸
研究了强磁场对Fe-49%Sn(质量分数)偏晶合金凝固组织演变及磁性能的影响.结果表明:施加强磁场可以显著改变富Fe相枝晶形貌,进而改善材料的磁性能。在无磁场作用下富Fe相为无方向性
城市房屋拆迁问题是现在全社会关注的焦点,各大新闻媒体有不断的报道,反映城市房屋拆迁领域的许多问题。本文通过分析我国城市房屋拆迁制度的历史和现状,结合国外相关土地和
交通是社会经济繁荣发展的载体,在城市化进程逐渐加快、交通拥堵日益严重的背景下,交通流理论的研究受到了学者的广泛关注。交通流的宏观特性是微观车辆运行特征的集合,流量的增
新时期以来,随着思想的不断解放,文化、科技事业的不断进步,中国电影事业也迎来了新的发展机遇,并取得长足发展。中国逐渐成为世界电影大国和强国。同时,发现现实世界中老年
通过分析草原文化的独特性与内蒙古特色产品标志设计的关系,并结合典型实例论述了内蒙古特色产品标志设计要以草原文化为基点的必要性。在此基础上,通过论证标志设计的图形、
采用球磨制粉和模压成型方法制备了铁硅铝磁粉芯,并研究了其频率特性和直流叠加特性。结果表明,在测量的频率范围内(1~500kHz),铁硅铝磁粉芯有效磁导率基本保持不变,而品质因数随频
本文以反导系统真假目标识别为研究背景,以中段目标群为研究对象,研究了基于RCS序列和基于一维距离像的弹道中段目标特征提取与特征评估方法、弹道目标雷达识别方法和分类器
宫颈癌是一种常见的,严重危害妇女健康的恶性肿瘤,目前宫颈癌已超过乳腺癌居女性恶性肿瘤第一位。华蟾素是从中华大蟾蜍干皮中提取得到的有效成分,主要含有吲哚生物碱、多肽