论文部分内容阅读
建筑能耗与工业能耗和交通能耗并称为社会三大能耗,已经成为制约我国经济长期快速增长的沉重负担。对既有建筑进行能耗预测,可以分析和改造设计方案,实现低耗能设计,对建筑节能设计具有指导意义。为了从庞大的建筑能耗数据资源中找到我们所需要的信息,必须依靠有效的数据分析和数据挖掘技术。传统的数据分类预测算法往往只能处理小样本数据,当建筑能耗数据样本规模很大时,计算量急剧增加,网络训练时间长,这成为传统算法的无法克服的问题。云计算的兴起,将传统的分类预测算法进行并行化处理,有效地解决了大规模数据分类预测问题。本文的主要研究内容为:(1)根据采集到的建筑能耗数据样本数据量大、维度高等特点,利用粗糙集理论进行数据样本的属性约简,以确定影响建筑能耗的主要因素。采用基于Map Reduce的大规模数据约简算法,与串行约简算法作对比,在获得相同的约简效果的同时,可以大大缩减数据预处理的时间,提高效率。(2)针对已经进行数据预处理的样本的输入输出特点,确定用于能耗预测的BP神经网络的拓扑结构,如网络层级数、每层的神经元数,连接方式,传递函数和学习算法等,构建建筑能耗预测模型。针对普通BP神经网络算法存在的训练时间长,容易收敛到局部极小值等缺点,采用遗传算法对已构建的网络模型进行优化,得到神经网络最优的初始权值和阈值,并将预测结果与标准模型进行对比。实验结果表明经过遗传算法优化的神经网络模型无论收敛速度还是预测精度都得到提高。该模型仅适用于小样本的建筑能耗预测。(3)利用基于RBF的建筑能耗预测模型,针对本文的输入输出参数,设计实验,实验结果发现基于RBF构建的模型收敛速度虽然比BP构建的模型收敛速度快,但是预测精度并没有很大程度的提高。相比于经过遗传优化的BP神经网络算法,RBF无论在收敛速度还是预测精度上都没有表现出优势。因此建筑能耗的预测模型选择BP神经网络模型,并利用遗传算法优化其初始权值和阈值。(4)寻找普通BP算法的并行点,并将其进行Map Reduce扩展,构建并行的大规模建筑生命周期能耗预测模型并部署在Hadoop分布式平台上实现。将本文提出的基于Map Reduce的BP神经网络算法应用于大规模建筑能耗预测中,实验中初始权值和阈值选择遗传算法优化得到的结果。在保证预测精度的前提下,本文提出的算法在面对大规模的建筑信息数据时有着传统BP算法无可比拟的优势,其运算速度明显优于传统算法。尤其是当传统算法无法对样本进行训练时,本文提出的算法优势更为明显。本文的创新工作主要体现在两方面:(1)数据预处理时采用了针对大规模数据的Map Reduce数据约简算法;(2)针对大规模建筑能耗数据,构建了基于Map Reduce的并行BP神经网络模型。