基于改进k-means算法的海量智能用电数据分析

被引:125
|
作者
赵莉
候兴哲
胡君
傅宏
孙洪亮
机构
[1] 重庆市电力公司
关键词
智能用电; 云计算; Map-Reduce处理模型; k-means算法; 并行挖掘;
D O I
10.13335/j.1000-3673.pst.2014.10.015
中图分类号
TM769 [电子计算机在电力系统中的应用]; TP311.13 [];
学科分类号
1201 ;
摘要
针对智能用电数据挖掘面临数据量大、挖掘效率低等难题,进行Map-Reduce模型下基于改进k-means的海量用电数据分析研究。以家庭用户为例,建立了家庭用户用电信息的家庭用户号、房屋面积、家庭成员数、每天用电量、峰谷电量、家用电器数等的数据维度模型,利用k-means算法简单、收敛速度快的优势,克服其容易陷入局部最优解的缺陷,综合考虑初始聚类中心的选择及聚类个数的选取2个因素,以数据对象密度的大小作为初始聚类中心的选取标准,将簇间距离及簇内对象的分散程度作为聚类数目选择的重要参考,对k-means算法进行改进;为提高数据处理效率,进行Map-Reduce处理模型下的海量家庭用户用电数据的并行挖掘。通过在Hadoop集群上进行实验,结果证明提出的算法运行稳定、高效、可行,且具有良好的加速比。
引用
收藏
页码:2715 / 2720
页数:6
相关论文
共 16 条
  • [1] 基于云计算的居民用电行为分析模型研究
    张素香
    刘建明
    赵丙镇
    曹津平
    [J]. 电网技术, 2013, 37 (06) : 1542 - 1546
  • [2] 智能电网大数据处理技术现状与挑战
    宋亚奇
    周国亮
    朱永利
    [J]. 电网技术, 2013, 37 (04) : 927 - 935
  • [3] 基于遗传改进蚁群聚类算法的电力客户价值评价
    李泓泽
    郭森
    王宝
    [J]. 电网技术, 2012, 36 (12) : 256 - 261
  • [4] 基于模糊综合评价的居民智能用电行为分析与互动机制设计
    何永秀
    王冰
    熊威
    张婷
    刘洋洋
    [J]. 电网技术, 2012, 36 (10) : 247 - 252
  • [5] 基于分布式键值对存储技术的EMS数据库平台
    闫湖
    周薇
    李立新
    戴娇
    韩冀中
    狄方春
    [J]. 电网技术, 2012, 36 (09) : 162 - 167
  • [6] 基于改进k-means算法的中文词义归纳
    张宜浩
    金澎
    孙锐
    [J]. 计算机应用, 2012, 32 (05) : 1332 - 1334
  • [7] 智能电网条件下的智能小区关键技术
    林弘宇
    田世明
    [J]. 电网技术, 2011, 35 (12) : 1 - 7
  • [8] 云计算:构建未来电力系统的核心计算平台
    赵俊华
    文福拴
    薛禹胜
    林振智
    [J]. 电力系统自动化, 2010, 34 (15) : 1 - 8
  • [9] 基于多目标聚类的用电集群特征属性计算
    刘友波
    刘俊勇
    赵岩
    李磊
    胥威汀
    姚珺玉
    侯贺飞
    [J]. 电力系统自动化, 2009, 33 (19) : 46 - 51
  • [10] Application of cluster analysis to preventive maintenance scheme design of pavement
    曾峰
    张肖宁
    [J]. Journal of Harbin Institute of Technology, 2009, 16 (04) : 581 - 586