论文部分内容阅读
随着经济的高速发展,建筑能耗在整体能源消耗的比重不断加大,同时大规模的能耗监管数据被采集和储存,这些数据中隐藏着大量的有用信息,但仅靠传统的统计方法很难发现。针对这一问题,本文利用数据挖掘技术,分析能耗监管数据属性间的关联模式和能耗节点的聚集性,为节能减排、资源利用提供了理论基础。本文的主要研究内容如下:首先,针对传统关联规则算法在挖掘过程中容易产生大量候选集,以及规则挖掘需要人为设定支持度、置信度阈值的问题,提出了一种自适应的融合粒子群与引力搜索的关联规则算法。该算法融合了粒子群的全局搜索能力和引力搜索的局部搜索能力,并且基于种群分布信息和进化状态实现了算法参数的自适应。UCI(University of CaliforniaIrvine)数据集的实验表明所提算法相比于其他对比算法能够更有效的挖掘关联规则,在此基础上,算法进一步地在江南大学的能耗监管数据库中进行关联规则的挖掘,为资源管理提供意见。其次,针对传统谱聚类算法在非线性低秩逼近过程中不能有效去除冗余属性,造成局部区域不能明显分辨而且计算复杂度较高的问题,提出了一种基于非线性低维嵌入特征提取的谱聚类算法。该算法利用非线性低维嵌入提取数据集特征,捕获数据的多簇结构,充分发掘了数据潜在的流形结构。UCI数据集的实验表明:所提算法提高了聚类性能,且降低了处理大规模数据集的复杂度。算法被进一步应用到江南大学的能耗监管数据库进行聚类,高效地划分出了不同的用电人群,为进一步分析能耗监管数据的隐藏知识提供基础。最后,为了进一步提高对能耗监管数据的聚类精度,为进一步分析提供更加精确的聚类结果。本文深入探讨图谱分析理论,提出了一种基于谱分析的蚁群聚类算法。该算法利用谱分析获得拉普拉斯矩阵的特征向量,从而构建出蚁群的初始化信息素矩阵,并在目标函数的指导下改进了原蚁群聚类算法的信息素更新、捡起对象等方式,使其能够具备较好的自组织聚类能力。实验表明:该算法能够高效地寻找到最优解区域,并将算法应用到江南大学能耗监管数据库的物联网数据子库,实现了对能耗节点的聚类,建立了能耗聚集性,并针对不同的类建立了周期性的能耗模式,并以此模式检测能耗异常点。