基于不同机器学习算法和集成学习的热负荷预测方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:kkk00011123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济的发展和科技的进步,化石能源改革持续推进,基于物联网、大数据和人工智能等信息技术的智慧供暖企业不断出现,清洁取暖和智慧供热正逐步成为目前供热行业发展的风向标。热负荷预测作为智慧供热中不可或缺的一个环节,传统的预测手段已不适用于当下和未来的使用需求。热负荷影响因素众多,不同的智能算法之间亦各有优势和缺点,如何建立高精度的热负荷预测模型,使之在不同场景下既能保证预测精度,又能具有良好的泛化能力,是当前热负荷预测方面需要重点解决的问题。本文基于空气源热泵集中供暖系统的系统运行参数和气象参数,从数据层面出发,探讨数据识别、数据清洗、数据衍生、数据降维和特征提取等数据处理方式对热负荷预测模型精度的影响,之后转到模型层面,分析不同智能算法和集成学习中的若干因素。首先,本文通过对供热系统自动采集的运行参数的质量分析,设计删除法与灰色预测插补结合的数据初步清洗方式,接着从数据衍生和数据降维的角度研究数据集增广和异常数据的进一步识别,采用k-means聚类和层次聚类相结合的方式进一步清洗数据。结果表明比热容阈值法可以作为一种快速的清洗手段,但通过kmeans聚类和层次聚类结合的方法构建的模型精度更高,其测试集RMSE低约15.7%。其次,通过在短期和长期两种时间尺度上的相关性分析,探究历史时刻热负荷与当前时刻热负荷的相关关系,结果表明短期内这种相关关系随时间间隔的增加而降低,在长期内存在明显的周期性,且每个周期的峰值随时间递减,但至多降低至零。此外,通过互信息法的度量,得到气象参数等变量对当前时刻热负荷的信息价值,结果表明干球温度、供回水温差和一天中的小时数是信息价值最高的四个变量。其中,一天中的小时数的互信息与供回水温差相差仅0.74%。然后,利用BP神经网络、回归树和支持向量回归三种不同的机器学习算法搭建共17个热负荷预测模型,研究BP神经网络结构和算法、回归树与支持向量回归超参数等因素对热负荷预测精度的影响,并结合时间成本与收益分析来对不同模型性能进行评估。从模型精度上看,BP神经网络模型精度要好于支持向量回归模型和回归树模型,但其RMSE值波动范围大,均衡性不如其余两种模型。从时间成本与收益方面分析,对基于L-M算法的浅层BP神经网络模型训练速度影响最大的是特征数,当隐藏层增加至2层后影响最为显著的因素是样本数。PCA主成分分析可以降低回归树模型和支持向量回归模型的训练时长,但在精度提升方面只对后者有效。精度要求高时基于L-M算法的BP神经网络时间收益最好,其次是回归树模型;精度要求不高时,回归树模型时间收益最好,BP神经网络模型和支持向量回归相差不大。最后,利用Bagging和Stacking两种集成算法,搭建随机森林集成模型和堆叠神经网络集成模型。集成模型性能相比其采用单一算法的初级学习器性能都要好,模型精度最高的是随机森林,其利用袋外误差做了特征删减后,测试集的RMSE值仍比回归树的低40%;堆叠神经网络模型相比集成前的BP神经网络、回归树和支持向量回归模型,测试集RMSE平均低22%。
其他文献
吉川幸次郎是日本著名的中国文学研究家,京都学派的代表学者。在吉川丰富的学术成果中,杜甫研究占据着最显著、最重要的地位。从40岁开始直到77岁逝世,吉川以注释全部的杜甫诗歌作为最终目标,将后半生的精力几乎都投入到钟爱的杜甫研究事业,这些学术成果被集中收录在《吉川幸次郎全集》中。吉川的研究业绩得到了中日学术界的广泛赞誉,在今天仍然具有重新审视的价值。本文在日本中国学研究的视域下,以吉川的杜甫及杜诗研究
学位
近年来,清洁能源发电产业的迅速发展,为固体蓄热电采暖技术的发展提供了肥沃的土壤。但目前存在的因固体蓄热部件抗热震性较差而直接导致的固体蓄热电暖装置抗热震性较差,正常使用寿命较短的问题,大大限制了固体蓄热电暖装置的推广应用。本课题针对以上问题,首先建立了一套适用于固体蓄热部件的抗热震性实验系统及分析方法,并以市面常见固体蓄热部件作为实验样本对实验系统进行可行性验证实验,实验结果表明:随着高低温冲击次
学位
结霜问题是目前限制空气源热泵推广应用的主要问题之一,当盘管表面温度下降到冰点且低于露点温度时,空气便会在室外换热器翅片表面结霜,霜层的生长会使流过蒸发器翅片的空气流量急剧衰减,机组换热能力会逐渐恶化,性能下降,甚至发生故障。结霜图谱能揭示空气源热泵机组可能发生结霜的室外温湿度范围,为除霜策略的开发提供指导,而关于变频空气源热泵结霜图谱的研究仍比较缺乏。目前在空气源热泵的结霜机理、抑霜和除霜方法、以
学位
菜市场作为重要公共服务设施,对于老年人更有着特殊意义,其布局关乎居民能否正常生活。中国老龄化现象不断加剧,老龄化社会对城市规划提出了新要求,优化菜市场空间布局对提高老年人的自主生活能力、保证健康饮食和愉悦心情、适度增强运动强度起积极作用。在老龄化水平不断攀升的社会背景下,保证寒地城市老年人无论何时均能舒适、方便地步行前往菜市场买菜对促进寒地城市健康老龄化有重要意义,也对菜市场空间布局提出了新的要求
学位
区域能源系统因为在实现多种能源科学、合理的综合应用以及节能降耗等方面有着独特的优势而受到青睐。规划初期区域能源系统的众多不确定因素使负荷具有不确定性,直接影响到供能系统的容量配置结果,影响着区域能源系统的综合优势和推广应用。因此,本文展开规划阶段区域能源系统负荷侧的不确定性对供能系统容量配置影响的研究。本文分析了规划初期区域建筑群的负荷特点,给出了适用于研究规划阶段区域建筑群的负荷计算方法。从概率
学位
在过去的几十年中,我国人口老龄化的趋势日益严重,老年人的心理健康问题逐渐受到关注。有研究表明积极的社会交往在改善老年人焦虑情绪,提升老年人心理健康状态方面发挥着重要作用。城市公园作为老年人日常的社会交往的主要场所,对于促进老年人社会交往、改善心理状态具有重要的作用,但是寒地城市冬季恶劣的气候降低了城市公园的环境质量,进而对老年人的心理健康造成负面影响。因此寒地城市冬季公园的环境设计研究对于老年人的
学位
本文在智慧交通和智慧校园的背景下,针对高校穿梭车管理人员难以匹配供需关系而导致的运营效率低和师生出行困难的问题,基于长短时记忆网络实现对未来不同时段的短时客流预测,协助车辆运营人员合理调度车辆,最终提出有效的客流预测应用系统,实现高效运管,提升师生出行满意度,促进校园智慧交通的建设。本研究在充分调研短时客流预测研究现状和用户需求的前提下,在算法预测方面,根据师生过往乘车支付数据的特点提出针对性的数
学位
体力活动的缺乏会增加健康风险,有规律地进行体力活动会降低慢性疾病发生的可能性。然而寒地城市受持续低温影响,室外活动环境热舒适性差,人们外出活动意愿降低,因此营造舒适的热环境、优化热环境主观感知对提升人们活动意愿以及活动水平进而促进健康至关重要。城市公园是服务公共健康的重要空间,老年人是公园内公共空间的重要使用群体,受生理、心理等因素影响,老年人往往表现出对热环境更为敏感、适应能力下降的特点,因此室
学位
冲突话语是指在言语交际中交际主体之间出现的异议、反驳、争吵、侮辱、谩骂等对抗性言语行为。冲突话语常常导致交际主体之间沟通的失败,为人们有效交际带来巨大挑战,因此化解冲突以实现言语平和与人际和谐成为人类交际中的永恒主题。冲突话语这一言语现象引起了各学科学者的关注,他们从不同角度对冲突话语进行解读,如心理学、语言学、交际学等视角。而近年来,在该领域研究中,关联理论颇受瞩目,它从认知角度对人类的语言交际
学位
词汇背景理论由Верещагин和Костомаров提出。他们认为,任何一种语言的词语中都携带有一定的民族文化成份。他们将带有民族文化义素的词语分为三类,即无对应词、背景词和文化伴随意义词。词汇背景理论认为,词由词位和义位构成,分别对应的是词的表达层面和内容层面,而义位由若干义素组成。按照是否参与对事物的分类,义素又可分为概念义素和非概念义素。根据Верещагин和Костомаров的定义,
学位