基于spark平台的供电煤耗并行回归预测

来源 :电力大数据 | 被引量 : 0次 | 上传用户:hwcf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对火电厂数据量大且复杂的特点,通过采用基于spark的并行回归算法,解决了传统供电煤耗回归预测模型所需的运行时间较长且预测精度较低的问题.本文采用了大数据平台中采集到的某电厂周期为一年的运行数据,对数据进行异常值筛选、空值填补等清洗及预处理过程,并对工况进行判稳,选取稳定工况下的健康数据进行数据分析,最后利用灰色关联度分析方法选择关联度最大的12个特征,对火电厂供电煤耗进行预测.通过参数调优建立基于spark的火电厂供电煤耗的随机森林和梯度提升决策树的并行回归模型,最后对实验结果进行比较分析和总结.结果 表明,随机森林回归模型和梯度提升决策树回归模型对火电厂的供电煤耗都有较好的预测效果,但随机森林回归模型预测的准确度相对更高.
其他文献
针对传统高压电缆故障检测时,需加直流高压和大电流,危险性大、对电缆绝缘造成损伤,以及需打开GIS筒体,各部门配合时间长、效率低等问题,采用了LIRA技术.通过向测试首端输入1-100MHz的混合波,对反射行波进行信号处理分析,将电缆中的阻抗不匹配点进行宽频阻抗谱人机交互界面展示,从而快速完成电缆故障定位.该方法测试电压仅为5V,无须打开GIS筒体,从而降低了高压输电电缆故障检测时危险性,减小了对电缆绝缘的损伤,提升了故障检测效率.从LIRA技术原理出发,与传统高压输电电缆故障检测方法比较,阐述了该技术应用
针对电网主变负载评估过程中搜索路径复杂,评估结果可靠性不足的问题,构建基于改进灰狼算法的电网主变负载自动风险评估模型.根据相对支持度和置信度,设置关联数据挖掘规则.基于改进灰狼算法设置跟踪搜索和自主搜索两种模式,获取主变负载影响因素;计算相关负载因子,得到老化、缺陷、告警、历史重载以及过载因子的实际值;明确风险指标,完成自动化风险评估.实验结果表明,所提方法的搜索路径最优,能够完成所有负载风险的评估,评估结果的可靠性较高,其自动化程度最高,对电网主变负载自动风险评估工作有重要意义.
油浸式变压器的DGA数据富含大量的变压器故障信息,深度剖析DGA数据与变压器的故障状况有利于实现油浸式变压器的故障诊断.然而,特征气体信息与变压器故障类型,故障程度间为复杂的非线性映射关系,给基于变压器油中溶解气体的变压器故障判断工作带来了困难.本文综述了从三比值法到专家系统、模糊理论、机器学习等智能诊断方法,简述了各方法的优点与不足之处,此外利用决策树较强的分类性能,提出了基于决策树的变压器故障诊断模型,实验结果表明,该方法较传统三比值法有一定的优势.最后,对未来的DGA数据智能算法分析研究提供一些思路
目前对电网覆冰灾害风险评估研究工作,缺乏对资料有效性评估手段,同时现有研究所考虑评价指标不够全面等缺陷.本文以贵州电网460条线路覆冰数据为例,从覆冰资料、微地形因子、气象条件出发,全面考虑与电网覆冰相关的13个评价指标,首先采用k-VNN算法对样本资料质量控制,剔除偏离较大样本;其次建立指标遴选判据,剔除对本文研究影响较小指标,并对可变指标气象因子,采用过程信息处理;最后采用LS-SVM算法建立电网覆冰灾害评估模型.研究表明:5.87%样本偏离程度较大,属于无用样本;山脊、坡向两个指标对电网覆冰影响较小
由于电网规模越来越大,结构也越来越复杂,导致继电保护定值配置面临巨大难度.在此背景下,针对以往系统反应慢,不能实现即点即用与所见即所得以及保护定值变更生成缺乏自适应性的问题,将电网结构与继电保护定值单有机结合起来,设计一种基于IEC61970-CIM的继电保护定值配置可视化管理系统.借鉴B/S架构设计系统框架,包括数据访问层、业务逻辑层以及可视化显示层;围绕C8051F040单片机搭建硬件系统,为系统选取合适的物理设备;基于IEC61970-CIM标准化技术、信息库同步技术、专家决策系统、指令模拟操作与防
基于风电机组运维历史大数据,探索齿轮箱油温异常预测性预警及异常原因分析的方法.首先,基于齿轮箱油温正常状态的SCADA运维大数据,在特征工程中采用方差排序、Pearson相关系数和递归特征消除进行降维,产生三个不同特征组合的数据集,分别建立LightGBM模型并选出表现最优的数据集;其次,选取boosting另外两个流行算法XGBoost与CatBoost作为对照算法,从均方误差(MSE),拟合优度(R Squared)等多个评价指标进行综合评价;最后,通过比较齿轮箱的预测油温与真实油温的偏离程度,在偏离
针对电力系统经常遭到外部网络的攻击与威胁,导致电力运行数据存在泄露的风险,为此提出了基于SON聚类的电力运行数据泄露风险预警方法.基于电力系统运行的实时状态,确定电力运行数据变换的动态阈值,根据电力运行数据的熵值变化,调整了动态阈值的大小.检测电力运行数据可能发生泄露的节点,根据电力运行数据的特征,利用SOM聚类的方法对电力运行数据样本进行采集、筛查和自适应分类.结合抽象标准化的处理规律,构建电力运行数据泄露风险预警模型,实现了电力运行数据泄露风险预警.实验结果表明,所提方法的预警准确率可达70%且波动幅
建设工业互联网成为了现代工业产业的共识,包括了安全、平台和网络三大体系,是实现智能化生产、服务化转型、个性化定制以及网络化协同的重要策略.工业互联网融合了IT和OT,因此面对的安全风险也逐渐增多,例如:攻击面增大、安全监控管理漏洞、安全态势可视化薄弱等.文章将通过介绍工业互联网安全发展的现状,分析解剖现有的安全方面,结合对安全构架的分析进行对典型方案的讨论,总结对工业互联网未来的展望.
为方便利用非线性Lamb波脉冲激励零频分量进行板材结构早期损伤超声无损健康监测,基于二次材料弱非线性,在基波和零频分量群速度相等的情况下,推导非线性Lamb波脉冲激励零频分量的理论解.以汉宁窗调制的短脉冲激励为例,建立仿真模型,提取仿真零频信号,制作零频信号传播动画,展示对称模态零频分量克服相速匹配条件的限制进而可持续累积的特征.理论仿真结果与分析讨论表明,零频模态为对称模态,零频形貌与窗函数形貌相似,基波群速度失配和色散可以分散零频分量能量进而影响零频形貌,零频分量可持续累积特性不受其影响,与二次谐波和
以实际使用的含有成分偏析带的贝氏体钢轨钢为研究对象,利用端面摩擦磨损试验机研究贝氏体钢在不同偏析角度下磨损性能的变化及组织变化规律.结果表明:贝氏体钢轨钢的磨损机理主要表现为粘着磨损、磨粒磨损和氧化磨损;基体局部在较大摩擦力的作用下会沿着磨损方向整体剥离,形成鱼鳞状纹理;随着载荷的增大,在磨损表面和纵截面亚表层会产生了大面积的剥离坑,同时还有大量的微裂纹形成;在不同偏析角度下贝氏体钢表现出不同的耐磨性能,在偏析位置为90°时,磨损失重速率显著增大,磨损量较大,符合铁路尤其是曲线段晃车抖车导致的磨损量增加的