基于聚类和深度学习的用户用电行为分析研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:xiaobaihuo197992
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子信息技术及数据处理技术的不断发展,智能电表的功能日益完善。智能电表作为电网信息系统中最基础的数据来源,除了计量功能外,还承担着海量信息存储、状态监测、自动控制等功能。然而由于信息处理技术的限制,目前电力行业数据分析在计算精度、计算时间、信息挖掘全面性等方面仍存在不足,无法满足用电大数据分析要求。在竞争性电力市场引入的同时,通过海量智能电表数据挖掘用户用电信息,结合用户用电特征实行精细化用户管理,提供差异化服务已经成为电力行业重要研究方向。其中,居民用电量数据尤为重要,掌握好用户的行为特性和用电需求,是智能电网的深层次发展的重要关键,所以关注点要切实落实到居民用电行为上,分析用电量数据就有很深远的研究意义。针对以上问题,本文主要研究基于深度学习和聚类算法研究用户行为。主要内容如下:(1)介绍聚类算法在电力领域研究动态,从数据预处理、用电影响因素和典型聚类算法概念进行阐述,建立聚类算法的基本框架;描述了用户用电行为的发展进程及现状,不仅帮助了解了电力事业发展的难点,也提供了其发展的方向。(2)为了更好地了解用户用电特点,通过肘部法则和聚类算法的用户分析方法,根据用户用电特性不同将用户进行分类,根据不同类别的用户用电模式分析曲线特性和负荷特性,了解用户用电规律,从而更好的为电力行业用户管理服务提供信息基础,实现用电需求性响应措施。肘部法则确定最佳聚类数目,K-means++算法精准分析用户用电行为曲线,研究其日、月、年负荷特征,帮助相关电力人员能够清楚了解居民用户用电的规律,并依据用电曲线特征提出合理的用电规划建议。(3)面对用电规划比较杂乱的缺点,通过一种适用于海量负荷数据的预测算法,根据不同的预测评价指标标准,全面地将长短期记忆网络(Long Short-Term Memory,LSTM)、循环神经网络(Recurrent Neural Network,RNN)、门控循环单元网络(Gated Recurrent Unit networks,GRU)等预测算法作对比分析,选择最适合的预测方法,即LSTM算法进行负荷预测,对特定用电模式进行预测,得到不同的预测结果,从而达到规划后续用电的目的。(4)通过数据分解和随机矩阵理论的方法用于智能电表用户用电数据中的异常检测的方法。首先介绍变分模态分解(Variational Mode Decomposition,VMD)算法相关知识,提出利用数据分解的方法剔除噪声影响;然后结合随机矩阵理论的常用定义与定理进行系统论述,提出基于单环定理、M-P定理和偏差曲线进行异常检测的方法;最后将该方法应用于从真实智能电表采集的用户用电数据分析,依据单环定理和M-P定理的异常检测标准进行精准判断,验证了数据分解和随机矩阵理论在分析高度相关的电力数据方面的有效性。
其他文献
现有的动态群体决策实践经常存在决策速度慢、观点不收敛的问题。本研究融入知识共享/转移的因素,从决策动态交互的过程视角,探讨决策绩效(一致性及决策时间)的改善机理、影响因素,从而提高相应绩效指标。研究通过构建决策过程模型,证明了知识共享/转移考虑下一致性序列在交互过程中的收敛性。同时,通过定性模拟判断知识共享/转移对决策时间的影响,以最小化决策时间为优化目标,搜索知识共享/转移水平,给出了个体知识差
目的 探讨2019—2021年天津市宝坻区人民医院住院患者多重耐药菌(MDRO)检出及耐药分析,为临床抗菌药物的合理应用提供依据。方法 收集2019年1月—2021年12月天津市宝坻区人民医院住院患者送检标本分离的MDRO,排除同一患者同一部位分离的重复菌株。采用法国生物梅里埃公司VITEK-2 Compact型全自动微生物鉴定与药敏分析仪进行病原菌鉴定和药敏试验。对临床使用的3类或3类以上抗菌药
我国是世界上老年人口最多的国家,截至2019年末,我国65岁及以上人口17603万人,占总人口的12.6%,预计2030年之后65岁及以上人口占总人口比重或超过20%,届时中国将进入重度老龄化社会,养老压力十分严重。据全国老龄工作委员会预测,2030年养老产业规模有望达成22万亿元,由此可见我国养老市场需求极大,但是我国养老服务市场发展缓慢,床位缺口较大,存在严重供需不匹配问题,近十年来随着我国对
由于大数据的数据量大和数据价值密度低的特性,用于解决信息过载的协同过滤推荐算法存在数据稀疏性问题,进而引发推荐效果不佳的结果,基于该问题提出了一种面向用户及评分信息的混合数据聚类推荐算法HDCRA(hybrid data clustering recommendation algorithm).针对既有评分数据和属性数据的用户混合数据,对用户进行相似度的计算并对用户进行聚类,使得在各个聚类簇中用户
目的 探讨头颈CT血管造影(CT Angiography,CTA)评估颈动脉粥样硬化狭窄程度、颈动脉斑块性质与数字减影血管造影(Digital Subtraction Angiography,DSA)诊断的一致性。方法 收集河北工程大学附属医院2021年1月至2022年3月收治的脑梗死患者105例作为研究对象,对患者行头颈CTA与DSA检查,并以DSA为“金标准”,将患者分为重度狭窄30例、中度狭
在大数据时代,广泛应用于各个领域的数据挖掘技术不断更迭,越来越多的企业致力于细分用户、深挖需求,力求最大化数据的商业价值。从过去几年的造车浪潮中不难看出,头部的造车新势力普遍采用了打造爆款、抢占市场的战略,对传统车企的营销环境产生了强力的冲击。新兴车企的发展势头强劲,究其原因,固然是借助了国家推行汽车智能网联化、汽车能源清洁化的时代东风;但更为重要的是,造车新势力对于现有及潜在用户数据的有效运用也
从群体角度精确计算分析不同用户群体感知价值的阈值区间,有助于识别用户群体的差异性,提升付费阅读服务水平,扩大数字收益。本文结合阅读付费意愿影响因素,采用K-means算法对付费阅读用户聚类获取用户群体,并对聚类后的用户群体数据进行M5模型树建模,确定不同用户群体感知价值的阈值区间及数据验证。研究发现,不同阅读用户群体感知价值具有明显差异性。总体上阅读群体的感知价值阈值存在0.722和0.396两个
当前,小学生口语交际水平不容乐观。语文课堂中的口语交际教学是提升小学生交际能力的“练兵场”,现实中存在着走过场轻实效、雷声大雨点小的情况。本文针对小学生口语交际教学现状,深入查找原因,提出针对性的意见和建议,为增强小学生口语交际能力添砖加瓦。
传统数据聚类算法缺乏对文本信息的挖掘,造成聚类效果较差,因此提出一种基于文本挖掘的多用户投诉数据流聚类算法。依据文本挖掘技术原理,选择支持向量机作为文本聚类模型,在算法设计中,首先提取多用户投诉数据文本特征,根据关键字权值和特征项总数,将高维度向量空间降维,删除无关紧要的特征项。使用综合度量法,计算Euclid距离、赫尔曼距离以及正弦相似度得到文本之间相似性,最后优化数据流聚类算法聚类流程,完成聚
专变用户非介入式负荷辨识是实现以专变用户为主体的需求侧响应的重要环节。通过对专变用户负荷稳态过程与暂态过程的特征分析,选取有功功率、无功功率、电流有效值等作为稳态过程特征量,并选取暂态发生前、中、后三个阶段的特征量,如电流有效值、有功功率均值、无功功率均值、持续时间、电流有效值最大值等,构建全面的非介入式负荷辨识稳态过程与暂态过程负荷特征空间。以此为基础,利用最小二乘QR分解算法(Least Sq