论文部分内容阅读
摘要:随着互联网技术的迅速发展,各行业其是销售行业得到了快速的发展,同时也产生了海量的相关数据资源。作为销售行业中的一部分,传统的人工分析模式已经无法为电厂直供电、供热和电力营销提供必要的数据分析。需要利用大数据挖掘与分析技术,从海量的电力营销数据中发掘潜在的、有价值的信息,快速有效地分析数据与信息,从而将各个信息孤岛相互汇集成为决策辅助信息系统,更好地保证电厂生产的安全运行、销售利润和市场竞争力。
关键词:大数据;支持向量机;数据挖掘;销售模式
经过多年的使用和运行,电厂信息化系统已经积累了海量的数据资源,这些数据信息是散乱的、无序的和庞大的,蕴含的知识和价值巨大。文章引入了大数据挖掘技术,利用大数据挖掘的优势创新电厂数据信息管理模式,提高电厂发展、服务水平和竞争力。
1 数据挖掘技术
随着互联网、信息化系统的运行和推广,系统运行积累了海量的数据资源,可以采用支持向量机、K近邻算法、BP神经网络等大数据挖掘技术,从宏观、微观等多维度构建电厂经济分析系统,挖掘电厂数据中潜在的有价值信息,指导电厂经营分析和管理,具有重要的作用。
1.1 支持向量机
支持向量机是一种基于分类的大数据挖掘技术,该挖掘技术可以针对非线性、高维空间的样本数据实现挖掘分析,能够利用核函数等优化数据挖掘过程,从海量的油品数据中挖掘高价值信息,并且能够为油品销售提供销售、经营、管理决策知识。支撑向量机可以与遗传算法、模糊数学、粒子群等思想集成在一起,实现算法优化,挖掘更多的信息知识。
1.2 K近邻算法
K近邻算法采用线性统计分类算法,已经在数据挖掘算法中得到了广泛的普及,是一种非常成熟的算法。K近邻算法的思路如下:给定一个样本数据,计算该样本与K个样本相似程度,选择相似程度最大的一个类别,将该样本划分为这个类别中。K近邻算法运行中,所选择的邻居都已经拥有自己的类别归属,其可以依据最邻近的一个数据对象或多个样本类别确定样本的归属,是一个比较简单的经典大数据挖掘算法,K近邻算法原理依赖于极限定理,但是在划分类别时,其仅仅与少量的样本数据对象存在关系,判定类别仅仅依靠少量的数据类别,对于类别交叉严重的待分类样本来讲,K近邻算法并不适合,需要采用更高档的学习器进行分类。
电厂经济性分析系统引入数据挖掘技术,可以达到以下几个目标:(1)关联分析。电厂经济性分析系统运行产生的大数据来源于发电、用电、传输等多个等环节,涉及各类型软硬件设备,这些数据信息资源存在极大的关联关系,比如简单关联关系、时序关联关系、设备一软件关联关系、日志操作关联关系等。(2)分类预测。电厂经济性分析系统引入大数据挖掘之前,许多信息数据保存的较为繁乱,比如供用电设备种类和数量多,设备购置、维修、更换等运行记录保存日期、位置、版本较多,容易产生不一致等特点。因此,分类预测可以根据电厂管理人员的需求,引入贝叶斯理论等构建一个分类算法,挖掘数据中相同类别的信息,这些类别可以是维修记录、购置记录,也可以是时间内容等,并且可以利用预测管理功能,预测设备运行趋势。(3)聚类分析。电厂大数据多是供用电设备运行自动产生的数据,相关子数据集缺乏详细的描述信息,此时可以采用聚类分析方法,将数据划分为多个簇,簇内保持高度的相似性、同构性,簇间保持较大的差别性,这就可以把相同类别的数据划分到一组,不同类别的数据划分到多个簇。(4)偏差检测。数据挖掘时发现数据集中的离群点或异常数据是一个重要的功能,比如电厂供用电网络安全监测,该功能被称为偏差检测。偏差检测主要包括分类中的反常实例、例外模式、观测结果对期望值存在的偏离以及量值可以随时间的变化而变化。偏差检测的方法寻找观察结果、参照之间的有意义差别,偏差分析的一个非常重要的特征是可以有效地过滤大量不感兴趣的模式。
2 基于数据挖掘的电厂经济性分析系统
近年来,我国各大电厂企业经过深层次和多方位改革、重组,电厂引入了先进的信息化技术,积累了海量的信息数据,但是数据整合存在较大的难度,无法快速提升电厂知名度和销售利润,更无法提升电厂企业竞争力。如图1所示,大数据挖掘可以从海量的电厂销售数据中发掘潜在的有价值信息,利用这些信息可以指导、创新电厂经营管理模式,构建一个电厂数据挖掘系统,为电厂经营提供主动化的推荐功能。电厂数据挖掘系统的一个显著特点是,能够收集电厂发电数据、售电数据等资料,并且根据用户兴趣偏好主动为用户做出个性化推荐,并且能够实时更新推荐内容,提高企业的服务水平。
电厂经营分析系统可以基于K均值算法构建自动分类用电群组。目前,人们生活中,不同的家庭购买的家用电器不同,用电量也是不同的,可以利用K均值算法构建一个自动分类的用户群,这样就可以将用户消耗的电量划分为高中低等档次,针对电量用户群可以制定一种更加优惠的措施,保证用户价值持续提升;针对中档次用户制定一些力度较大的电量优惠措施,培养用户高电量习惯,这样就可以把中档次用户提高为高档次用户。另外,电厂也可以使用BP神经网络可以构建一个电量需求识别模型,这样就可以分析不同家庭用电器耗费的电量,更好地向用户推荐耗电量较小的电气,这对于提高用户电量的有效利用率具有重要的作用和意义。具体地,电厂经营分析管理模式可以划分为以下几个方面:
2.1 联想销售,个性化推荐服务
基于用户购买行为实现个性化推荐服务。利用大数据挖掘技术,可以获取用户购买的电力能源的记录,并且统计客户的行业信息,为客户提供个性化的推荐服务,比如定制消防档次,推荐低能耗家用电器等。
2.2 用户群分,差异化营销
实现用户群分,不同等级客户采用差异化营销。采用K近邻算法可以构建用户群分模型,主题可以是购买频次、售电金额等,针对售电金额较多的大客户、价值较高的客户推送力度较大的优惠信息,更好地黏住客户,持续为电厂经营管理创造价值。
2.3 电量历史销量预测,择机销售
电量销售预测与分析。随着人们的生活质量提高,电力能源已经成为千家万户群众和工厂的重要能源之一。不同的季节、不同的时间段,人们的耗电量是不同的,因此可以采用支持向量机、BP神经网络等大数据分析技术,从电量销售数据中挖掘用电量高峰,展示各个季节的电量销售数量、时间段,细化电量销售的具体情况,以便能够预测电量销售高峰发作时间段,保证电厂可以提供充足的电量能源。
2.4 专家库,提升电量销售决策知识
构建电量销售专家分析库,便于电厂企业经营决策。电量数据挖掘分析过程中,可以采用现有的经验知识构建一个功能丰富电量专家决策库,以便能够为电厂提供经营、管理决策知识,帮助电厂制定战略销售决策时具有较高方向性,便于持续改善电厂的发展能力、竞争能力。
3 结语
随着“互联网+”的诞生和发展,电厂可以充分地利用大数据挖掘技术发现电量销售数据中潜在的有价值信息,实现电量用户群分、差异化营销,满足电量销售多样化需求,提高电厂市场竞争力和利润。
关键词:大数据;支持向量机;数据挖掘;销售模式
经过多年的使用和运行,电厂信息化系统已经积累了海量的数据资源,这些数据信息是散乱的、无序的和庞大的,蕴含的知识和价值巨大。文章引入了大数据挖掘技术,利用大数据挖掘的优势创新电厂数据信息管理模式,提高电厂发展、服务水平和竞争力。
1 数据挖掘技术
随着互联网、信息化系统的运行和推广,系统运行积累了海量的数据资源,可以采用支持向量机、K近邻算法、BP神经网络等大数据挖掘技术,从宏观、微观等多维度构建电厂经济分析系统,挖掘电厂数据中潜在的有价值信息,指导电厂经营分析和管理,具有重要的作用。
1.1 支持向量机
支持向量机是一种基于分类的大数据挖掘技术,该挖掘技术可以针对非线性、高维空间的样本数据实现挖掘分析,能够利用核函数等优化数据挖掘过程,从海量的油品数据中挖掘高价值信息,并且能够为油品销售提供销售、经营、管理决策知识。支撑向量机可以与遗传算法、模糊数学、粒子群等思想集成在一起,实现算法优化,挖掘更多的信息知识。
1.2 K近邻算法
K近邻算法采用线性统计分类算法,已经在数据挖掘算法中得到了广泛的普及,是一种非常成熟的算法。K近邻算法的思路如下:给定一个样本数据,计算该样本与K个样本相似程度,选择相似程度最大的一个类别,将该样本划分为这个类别中。K近邻算法运行中,所选择的邻居都已经拥有自己的类别归属,其可以依据最邻近的一个数据对象或多个样本类别确定样本的归属,是一个比较简单的经典大数据挖掘算法,K近邻算法原理依赖于极限定理,但是在划分类别时,其仅仅与少量的样本数据对象存在关系,判定类别仅仅依靠少量的数据类别,对于类别交叉严重的待分类样本来讲,K近邻算法并不适合,需要采用更高档的学习器进行分类。
电厂经济性分析系统引入数据挖掘技术,可以达到以下几个目标:(1)关联分析。电厂经济性分析系统运行产生的大数据来源于发电、用电、传输等多个等环节,涉及各类型软硬件设备,这些数据信息资源存在极大的关联关系,比如简单关联关系、时序关联关系、设备一软件关联关系、日志操作关联关系等。(2)分类预测。电厂经济性分析系统引入大数据挖掘之前,许多信息数据保存的较为繁乱,比如供用电设备种类和数量多,设备购置、维修、更换等运行记录保存日期、位置、版本较多,容易产生不一致等特点。因此,分类预测可以根据电厂管理人员的需求,引入贝叶斯理论等构建一个分类算法,挖掘数据中相同类别的信息,这些类别可以是维修记录、购置记录,也可以是时间内容等,并且可以利用预测管理功能,预测设备运行趋势。(3)聚类分析。电厂大数据多是供用电设备运行自动产生的数据,相关子数据集缺乏详细的描述信息,此时可以采用聚类分析方法,将数据划分为多个簇,簇内保持高度的相似性、同构性,簇间保持较大的差别性,这就可以把相同类别的数据划分到一组,不同类别的数据划分到多个簇。(4)偏差检测。数据挖掘时发现数据集中的离群点或异常数据是一个重要的功能,比如电厂供用电网络安全监测,该功能被称为偏差检测。偏差检测主要包括分类中的反常实例、例外模式、观测结果对期望值存在的偏离以及量值可以随时间的变化而变化。偏差检测的方法寻找观察结果、参照之间的有意义差别,偏差分析的一个非常重要的特征是可以有效地过滤大量不感兴趣的模式。
2 基于数据挖掘的电厂经济性分析系统
近年来,我国各大电厂企业经过深层次和多方位改革、重组,电厂引入了先进的信息化技术,积累了海量的信息数据,但是数据整合存在较大的难度,无法快速提升电厂知名度和销售利润,更无法提升电厂企业竞争力。如图1所示,大数据挖掘可以从海量的电厂销售数据中发掘潜在的有价值信息,利用这些信息可以指导、创新电厂经营管理模式,构建一个电厂数据挖掘系统,为电厂经营提供主动化的推荐功能。电厂数据挖掘系统的一个显著特点是,能够收集电厂发电数据、售电数据等资料,并且根据用户兴趣偏好主动为用户做出个性化推荐,并且能够实时更新推荐内容,提高企业的服务水平。
电厂经营分析系统可以基于K均值算法构建自动分类用电群组。目前,人们生活中,不同的家庭购买的家用电器不同,用电量也是不同的,可以利用K均值算法构建一个自动分类的用户群,这样就可以将用户消耗的电量划分为高中低等档次,针对电量用户群可以制定一种更加优惠的措施,保证用户价值持续提升;针对中档次用户制定一些力度较大的电量优惠措施,培养用户高电量习惯,这样就可以把中档次用户提高为高档次用户。另外,电厂也可以使用BP神经网络可以构建一个电量需求识别模型,这样就可以分析不同家庭用电器耗费的电量,更好地向用户推荐耗电量较小的电气,这对于提高用户电量的有效利用率具有重要的作用和意义。具体地,电厂经营分析管理模式可以划分为以下几个方面:
2.1 联想销售,个性化推荐服务
基于用户购买行为实现个性化推荐服务。利用大数据挖掘技术,可以获取用户购买的电力能源的记录,并且统计客户的行业信息,为客户提供个性化的推荐服务,比如定制消防档次,推荐低能耗家用电器等。
2.2 用户群分,差异化营销
实现用户群分,不同等级客户采用差异化营销。采用K近邻算法可以构建用户群分模型,主题可以是购买频次、售电金额等,针对售电金额较多的大客户、价值较高的客户推送力度较大的优惠信息,更好地黏住客户,持续为电厂经营管理创造价值。
2.3 电量历史销量预测,择机销售
电量销售预测与分析。随着人们的生活质量提高,电力能源已经成为千家万户群众和工厂的重要能源之一。不同的季节、不同的时间段,人们的耗电量是不同的,因此可以采用支持向量机、BP神经网络等大数据分析技术,从电量销售数据中挖掘用电量高峰,展示各个季节的电量销售数量、时间段,细化电量销售的具体情况,以便能够预测电量销售高峰发作时间段,保证电厂可以提供充足的电量能源。
2.4 专家库,提升电量销售决策知识
构建电量销售专家分析库,便于电厂企业经营决策。电量数据挖掘分析过程中,可以采用现有的经验知识构建一个功能丰富电量专家决策库,以便能够为电厂提供经营、管理决策知识,帮助电厂制定战略销售决策时具有较高方向性,便于持续改善电厂的发展能力、竞争能力。
3 结语
随着“互联网+”的诞生和发展,电厂可以充分地利用大数据挖掘技术发现电量销售数据中潜在的有价值信息,实现电量用户群分、差异化营销,满足电量销售多样化需求,提高电厂市场竞争力和利润。