基于改进k-means算法的海量智能用电数据分析

来源 :电网技术 | 被引量 : 0次 | 上传用户:juanzi0666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对智能用电数据挖掘面临数据量大、挖掘效率低等难题,进行Map-Reduce模型下基于改进k-means的海量用电数据分析研究。以家庭用户为例,建立了家庭用户用电信息的家庭用户号、房屋面积、家庭成员数、每天用电量、峰谷电量、家用电器数等的数据维度模型,利用k-means算法简单、收敛速度快的优势,克服其容易陷入局部最优解的缺陷,综合考虑初始聚类中心的选择及聚类个数的选取2个因素,以数据对象密度的大小作为初始聚类中心的选取标准,将簇间距离及簇内对象的分散程度作为聚类数目选择的重要参考,对k-means算法进行改进;为提高数据处理效率,进行Map-Reduce处理模型下的海量家庭用户用电数据的并行挖掘。通过在Hadoop集群上进行实验,结果证明提出的算法运行稳定、高效、可行,且具有良好的加速比。
其他文献
在互联网新时代中,IT信息技术和互联网正在与传统的印刷包装产业深度融合,并运用大数据、人工智能等先进技术手段对印刷包装产业升级改造。自"互联网+印刷"的经营模式被印刷人甚
提出了一种地铁盾构隧道洞门中心求解的新方法。以武汉市轨道交通四号线二期工程玉龙路站~永安堂站右线盾构区间永安堂车站洞门为例,利用外业实测数据推导计算出洞门中心坐标
专题地图绘图系统(TMMS)的基本功能艾自兴,郭庆胜(武汉测绘科技大学)一、引言机助制图的讯速发展.使地图绘制自动化逐步进入了实用化阶段。专题编图的最终成果是专题地图。根据对专题数
<正>2009年12月24日,全球最大太阳能办公大楼于山东德州太阳谷正式启用。这座名为"日月坛-微排大厦"的太阳能大楼,总建筑面积达到7.5万平方米,集展示、科研、办公、会议、培
地图的信息组织及表达是地图编制的重要内容,根据城市公益地图的功能及特征,探讨了其合理的信息组织结构,并通过构建地图信息结构视觉层次来实现城市公益地图服务公众的目的
"莫扎特效应"曾在21世纪初对学界、商界、政界产生过重要影响,它的终结根本上是由于夸大了儿童音乐教育对儿童智力培养的作用,并进而使音乐教育远离了其本体功能。人们对"莫
职业生涯管理实质是对人力资源的管理,指个人和组织对职业历程的规划、职业发展的促进等一系列活动的总和。本文以职业生涯管理为视角探讨当代幼儿教师的专业发展问题,提出幼
<正> 我国古代越族分布地域很广,"自交趾至会稽七八千里,百粤(越)杂处,各有种姓,不尽少康之后也."林惠祥在《中国民族史》一书中具体指出:"百越所居之地甚广,占中国东南及南
现代社会涌现的各种新媒体技术对传统报纸媒体的发展构成了严峻的挑战。新媒体背景下,报纸编辑必须要有足够的危机意识,认识到自身角色转型的必要性以及具体途径。报纸编辑可
本文以目标理论为指导,强调认为课堂教学目标是课堂教学的出发点和归宿。文章通过对职高英语教学三维目标设计的阐述,提出了一些在实践中的实施措施。