基于大数据平台的供热二次管网的异常检测系统

来源 :山东大学 | 被引量 : 0次 | 上传用户:gugugou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来供热二次管网的平衡调控与节能逐渐成为供热企业关注的焦点。随着热计量器具的大量安装和海量数据的自动采集,供热企业积累了大量的供热末端数据。但是这些数据有着数据量大、存在较多缺失值及有一定失真度等问题,使得供热企业缺乏合适的平台工具发挥这些数据的作用。基于上述问题,本文对热计量表数据进行清洗与筛选,通过分布式孤立森林算法将异常点筛选出来,并使用高斯混合模型算法将异常点聚类,从而正确识别出供暖异常情况。本文以实际工况下的供热数据为原始数据,利用Spark并行化的优势对数据库中的多个大表进行信息整合与过滤,通过拉格朗日插值算法对缺失值进行填补,应用统计方法与绘图的方式简单分析供热数据的特点,并通过互信息过滤法和随机森林嵌入法相结合的方式对数据集进行特征选择。本文分别设计并实验K均值算法(K-Means)、高斯混合模型算法(GMM)、孤立森林算法(IForest)来检测出供热异常的数据,通过实验可以得出孤立森林算法在误报率(FPR)和查全率(TPR)等指标都优于异常检测常用的K均值算法和高斯混合模型算法。本文开发了基于大数据分析的供热质量监测系统,该系统集成了 Spark大数据读取模块、数据清洗模块、数据可视化模块、生成异常报告模块,封装了多种异常检测的算法,使供热企业能够更加方便的获悉供热质量的情况,以便快速及时的采取相应的措施来解决供热异常的问题。
其他文献
近年来,稀土发光材料因其吸收特性强、物理化学性质稳定、发光转换效率高等优点,已成为发光材料研究的重点和前沿,并在国民经济和国防建设中占有举足轻重的地位。本文重点研
一直以来,伽玛函数比率问题都是重点研究的问题之一,在许多领域上有着广泛的应用。例如:Minc-Sathre quotient和Wallis ratio都是通过伽玛函数比率来计算的,Mellin-B arnes型积分和超几何函数积分的研究需要借助伽玛函数的比率;一些分布的密度函数可以用伽玛函数比率来表示,分布的分位点的计算也离不开伽玛函数的比率。此外用于检验多总体协方差矩阵是否相等的似然比统计量的对
毫米波(millimeter wave,mm Wave)大规模多输入多输出(multiple-input mutiple-output,MIMO)系统已成为下一代蜂窝网络研究的关键主题。由于基于选择器的混合大规模MIMO系统
随着航空航天等高端领域的快速发展,对一些难加工材料的表面质量要求越来越高。磁力研磨(MAF)作为光整加工技术中的一种,可以很好地改善工件的表面质量。但是目前的磁性磨料(MAP)多以Al_2O_3、SiC等普通硬度磨粒相的磨料为主,只能改善一些普通材料的表面性能,对高端领域所需的一些难加工材料很难满足其加工要求。本文通过对雾化喷嘴的改进,利用双级雾化系统成功制备出CBN/铁基球形复合磁性磨料,经过磁
深对流云是大气质量垂直输送的主要载体,可以将含有各种污染物的大气在相对较短的时间内由对流层低层输送至对流层上层甚至平流层低层,影响区域及全球环境和气候。目前对对流输送作用的研究多集中于对痕量气体垂直分布特性的分析,且国内对此的研究还比较少,为此本文采用考虑详细微物理过程和化学气体传输过程的云模式模拟了2014年7月30日发生在南京西北部一次深对流过程,研究了深对流活动对大气化学成分的输送及再分布作
具有良好光束质量的高峰值功率的超短脉冲激光是基础科学和工业领域不断拓展新应用的重要工具。单链路光纤激光是产生高功率脉冲输出的一种手段,虽然具有热管理方便、光光转换效率高等特点,但是受限于非线性、模式不稳定等因素,难以在提升峰值功率的同时保持良好的光束质量。时域相干合成技术通过将多路较低功率的光束相干合束,实现高峰值功率、高光束质量的脉冲输出,成为研究的热点。本文以超短脉冲光纤激光时域相干合成为研究
临界理查森数(Ricr)在YSU边界层参数化方案中为一重要参数,被用来诊断边界层高度(PBLH),随着大气稳定度的变化,临界理查森数也会随之变化。本文利用WRF-Chem模式探讨不同临界理查森数对边界层高度诊断以及对地面气象场影响,并基于YSU边界层参数化方案湍流扩散方程,输出局地通量项、非局地通量项和夹卷通量项,分析临界理查森数对各通量项影响以及各通量项对总通量的贡献,同时探讨临界理查森数对污染
素描人脸图像不仅是生活中极具艺术风格的肖像画作,有时也能成为刑侦方面帮助警方寻找相关人员的重要线索。随着科技的发展与进步,人脸识别技术已经比较成熟并被广泛应用于各
我国是一个名副其实的世界海运大国,但是相比国际上其他国家船舶油污损害赔偿基金的发展而言,我国船舶油污损害赔偿基金设立时间短、制度发展缓慢、对船舶油污损害受害人赔偿
大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)技术作为第五代(5th-Generation,5G)移动通信网络的研究重点,是指收发两端设置成百上千根天线数目,提高系统的信道