论文部分内容阅读
建筑节能设计离不开能耗模拟,而建筑能耗模拟与室外气候数据密切相关,气候数据的变化直接影响建筑能耗模拟的结果。由于在对气候数据进行测量时,造成用于能耗模拟的气候数据质量差,使得能耗模拟可信度差,因此,对气候数据进行清洗尤为必要。迄今为止,研究人员已提出许多不同的数据清洗方法,这些方法能够有效地对异常数据、缺失值进行清洗,但对气候数据中的异常数据清洗,大多数只是简单的统计计算并将异常数据剔除、过多的人工干预以及对异常数据的修正缺少一定的根据性。本文针对已有异常数据清洗方法在气候数据处理中的不足,从不同角度研究了异常数据清洗方法并在已有的基础上提出了基于聚类神经网络的方法对气候数据清洗。论文的主要工作如下:第一,研究了数据存在的质量问题以及数据清洗的基本原理和基本过程,特别是对异常数据清洗方法做了深入研究。在已有的异常数据清洗方法基础上,使用基于K-means聚类的方法对气候数据进行分类。第二,由于K-means聚类算法对异常数据的处理不足,本文使用最小二乘法设定阈值提高聚类效果。首先分析气候要素中对能耗模拟有着重要影响的因素;接着,使用最小二乘法设定阈值并检测出异常数据;最后,将异常数据存放在数据集D中。第三,将分类后的数据集和数据集D中的数据作为BP神经网络的训练样本,进行网络设计和训练,建立映射关系并得到网络模型。通过输入待测数据,比较网络输出值与真实值,计算网络输出值与真实值的误差,如果误差在设定范围内,则为正常数据,反之,为异常数据并使用网络值修正,从而实现气候数据清洗。通过实验表明,本文提出的聚类神经网络方法能够有效地提高气候数据的质量,对气候数据的有效清洗率高达95.1%,从而提高后续建筑节能设计和建筑能耗模拟结果的可信度,为气候数据研究提供一定的理论支持。