摘要为解决用户在开展节电工作时面临的用电数据不透明、缺少节电指导依据等问题,提出大数据背景下基于数据挖掘的用户节电通用分析方法,并在大数据平台上予以并行化实现,设计了直观的可视化展示形式。首先依据用户用电特性通过高维聚类实现了用电群体细分,然后融合电力、气象、经济等多维度数据开展节电

首页 > 配售电 > 能源服务 > 评论 > 正文

深度|用户节电的大数据分析及应用

2019-04-15 10:43 来源:电网技术 

摘要

为解决用户在开展节电工作时面临的用电数据不透明、缺少节电指导依据等问题,提出大数据背景下基于数据挖掘的用户节电通用分析方法,并在大数据平台上予以并行化实现,设计了直观的可视化展示形式。首先依据用户用电特性通过高维聚类实现了用电群体细分,然后融合电力、气象、经济等多维度数据开展节电分析,基于用户能效综合评估确定群体内节电标杆并量化用户节电潜力,接着通过多源数据关联分析获得用户节电策略,最后,通过SparkR在大数据平台上实现了节电算法业务的并行化,基于JavaWeb MVC框架实现了分析结果的可视化展示。实际应用效果表明,所提出的节电大数据分析方法,能有效关联多源数据,实现对海量用户数据的高效分析。

关键词 :大数据;节电分析;分布式存储;并行化计算;数据可视化;

(来源:电网技术作者:陈海文1, 王守相1, 梁栋2, 苏运3)

1.智能电网教育部重点实验室(天津大学),天津市 南开区 300072

2.电工装备可靠性与智能化国家重点实验室(河北工业大学),天津市 北辰区300401

3.国网上海市电力公司,上海市 浦东新区 200122

0 引言

用户侧节电是近年来我国节电工作的开展重点[1],而电力用户作为节电业务的实施主体,开展节电工作的积极性不高,究其原因,用户在用电时具有很强的盲目性,用电数据不透明,用户缺少获知自身耗电水平及用电特点的信息渠道,难以发现用电过程中存在的问题,节电工作开展缺乏指导性建议,而如果由节能公司进行侵入式的节电评估则时间长、价格高。

由于数据来源及数据规模限制,现阶段还未有通用的用户节电分析流程方法,已有研究工作主要针对特定行业的个别用户[2],尚缺乏从用户用电群体角度开展的节电分析研究。如文献[1]针对能效电厂项目,从节电量和移峰填谷2个方面计算了节电潜力。文献[3]分析了北欧建筑照明设备的构成,估算了通过更新照明设备带来的节电潜力。但这些针对具体行业或者设备的建模分析方法并不具有通用性。文献[4-5]从省级区域的角度分析了中国能源短缺情况及各省份的节电潜力,对具体用户缺少指导作用。建立适用于各行业用户的具有通用性的节电分析方法,并针对具体用户给出节电指导建议是当前研究的难点。由于即便在同一行业,用户用电规模、用电行为差异化明显,找到海量用户之间的群体性规律是节电分析重点。

此外,对标是督促指导用户节电有效手段,目前节电标杆往往由国家标准或者同行业先进水平来确定,尚缺少对节电标杆选取的相关研究。在目前我国社会经济持续发展及产业结构不断调整的背景下,用户的用电特性越发多样化,同一行业的不同用户用电特性差异巨大,难以确立在整个行业范围内具有代表性及典型性的节电标杆。由相关管理部门确定的国家标准或者行业先进水平则由于新技术、新设备的不断发展而导致时效性较差。因此需要在群体细分基础上,提出一种考虑多因素的用户能效综合评估方法以确定节电标杆。

随着大数据产业的不断发展和智能电网建设的不断推进,供电公司对生产数据、营销数据、社会经济数据、地理信息数据的积累日益增加[6-7],形成了以数据种类多,规模大,异构特征突出,关联复杂为特点的配用电大数据[8-11]。在大数据背景下的用户节电分析,对数据管理、数据处理、数据分析、数据可视化等关键技术提出了更高的要求,给节电分析平台开发带来很大挑战[12]。文献[8]在实验室环境下搭建了用于负荷预测的Hadoop平台,并设计了一种并行化的随机森林算法用于负荷预测。文献[9]建立了用于供电安全性分析的大数据平台。文献[10]搭建了电力设备的运行状态监测的大数据平台,提高了数据读写效率,并利用联机分析处理技术对电力设备的运行状态进行监测。

用户节电分析涉及气象、社会等诸多因素,具有极强的关联性;在算法方面,涉及到高维聚类,多因素关联等多种算法,对计算速度提出了较高要求;由于节电分析平台服务对象是电力用户,对结果展示的准确性、直观性要求更高。传统的平台开发工具,架构设计,交互方式及展示形式无法满足大数据下节电分析的客观需求。针对以上问题,本文提出了基于数据挖掘的用户侧节电分析方法,包括用电特性高维聚类、综合能效评估、考虑多因素的节电策略构建等步骤,并在大数据分析平台上实现了相关算法业务的并行化,大大提高了分析效率。分析结果通过Web发布,易于用户访问,网页利用HTML5、Javascript组件实现了图表的动态交互,便于用户从多维度直观了解自身用电情况,有针对性地开展节电工作。

1 用户节电分析流程

1.1 用户节电分析路线

首先,通过用电特性高维聚类,得到典型用电模式及用电群体,在每个群体内通过综合能效评估选择标杆用户作为节电基准,计算得出群体内各用户的节电潜力,进而通过对用户节电潜力以及其他关联因素的挖掘,利用偏最小二乘回归算法,计算气候、社会等多因素的节电灵敏度系数,并分析用户用电行为,结合已有的节电策略库,通过决策树算法提供个性化、有针对性的节电策略。算法流程如图1所示。

33.png

1.2.1 基于分布式两阶段聚类的用电模式分析

以K-means为代表的聚类算法在负荷分类、用电模式发现中得到了广泛应用[13-15]。由于实际上普遍存在的用电数据的缺失会严重影响聚类的准确性,为此,本文采用传统距离标准与向量统计特征进行加权调和的思想,来克服数据缺失对聚类准确性的影响,从而能在一定程度上降低对数据清洗的要求[16]。以K-means算法为例,将距离度量改进为

0.png

为了适应大规模数据集处理,提出一种分布式两阶段聚类算法:首先利用基于统计距离的K-means算法对用户进行聚类分析,得到其用电模式;然后将得到的单用户典型日用电曲线作为原始曲线再次进行层次聚类[16],通过层次聚类控制用电模式的数量,从而得到用户群体的典型用电模式。并行化实现方式可见第2节。

34.png

抽取1000个用户进行用电模式分析,重复进行3次实验,结果如表1所示,对比聚类融合算法与直接聚类算法,两阶段聚类稳定性提高了47%,类内轮廓系数指标提高了27%,表明两阶段聚类融合算法能提高聚类的稳定性及准确性。以物业管理用户为例,获得典型的用电模式如附录图A1所示。

35.png

1.2.2 基于t-SNE及子空间聚类的用电群体细分方法

规模相近、特性相似的用户之间才具有节电分析的可比性,本文提出了通过多维度指标聚类划分行业内细粒度用电群体的方法。除用户96点功率数据外,统计各用户每月平均电量消耗、年最大利用小时数、负荷密度、典型日平均负荷率、季度不平衡系数、峰谷电量比[17],此时样本维度可达96+12+5=113维,且不同指标之间的度量含义并不一致,不能直接进行聚类。采用子空间聚类与降维结合的方法,把时间序列数据投影到L1,L2两个子空间[17],使用基于统计距离的K-means算法进行聚类。而对于非时序评价参数在子空间L3中,使用t-SNE[18]流形学习方法进行降维。其中子空间聚类基于“自上而下”的搜索策略。

对于t-SNE降维后的非时序评价参数,由于各单位量纲不同,在对应的子空间上采用标准欧氏距离作为距离评价指标。对于2个n维向量A={x11,x12,..,x1n}及B={x21,x22,…,x2n},标准欧氏距离定义如下所示。

01.png

1.3 用户能效综合评估及节电标杆选取

通过用电特性高维聚类获得细分用电群体后,采用综合能效评估的方法来选择标杆用户。本文采用层次分析法对群体内用户能效水平进行综合评估[19],分层建立用于群体标杆用户选择的电力用户能效评估指标体系[20]。如图3所示,指标层从上而下分别为:U= {电力用户能效水平},Uk= {经济能效,电类信息,生产效率,电能污染},以及包含各类单项指标的Uij层[20]。层次分析法流程本文不再赘述,对各项分指标而言,依据数据特点可分为3类:极大型、极小型、区间型。如节电量u14、经济增加值u12属于极大型评价指标,峰谷电量比u21、万元产值耗电量u31、万元产值电费u32等属于极小型评价指标,对于负荷率u23及电能污染u4的相关指标属于区间型指标,其特点是满足国家要求的区间即可获得得分,相同区间内不再细化比较得分。

36.png

对于极大型评价指标采用等频离散化的方法,给定划分区段个数,并保证每个区段内样本数量个数相同,在本文中考虑到用电群体数量一般为几百数量级别,将区段个数设置为20,每个区段对应用户数量为5%,映射得分到0~100区间,降序排序位于前5%用户得分为100, 5%~10%用户得分为95以此类推。对于极小值类型评价指标按升序排序,离散化过程与极大型评价指标类似。对于区间型评价指标采用等宽离散化方法,即按照国标指定得分区间,不考虑区间内用户数量。通过层次分析法计算每个用户综合能效得分,并选择得分最高的用户作为用电群体的标杆用户。

02.png

1.4 考虑多因素的节电策略构建

1.4.1 环境感知敏感性分析

用户用电行为、用电设备的差异导致环境因素对不同用户的节电潜力影响差别较大。分析用户对不同环境因素的敏感度,能够反映用户负荷特点,提高节电策略的有效性。本文考虑的环境感知因素如表2所示。

37.png

最小二乘回归法是相关性分析中的常用方法,但是在自变量系统存在严重的多重自相关性时,最小二乘回归模型的精确性会大大降低,并且在自变量筛选阶段往往要采用向前或者向后删除变量的方法,增加了工作负担[21]。本文采用偏最小二乘回归计算环境感知敏感性系数。偏最小二乘回归结合了传统线性回归、主成分分析等方法的优点,在自变量存在严重的多重相关性的情况下,所建立的模型准确性更高,同时能够进行显著性分析,便于发现影响节电潜力的关键因素[21]。由于回归分析各变量的量纲不同,采用标准化回归分析模型进行分析。以某物业管理行业用户为例,偏最小二乘回归结果如附录表A1所示。

1.4.2 用电成本分析

我国实行峰谷分时电价来刺激和鼓励电力用户移峰填谷、优化用电行为,高峰、低谷时段电价可按基础上下浮动60%。由于用户间用电行为差异,相应用电电价成本也会有所不同。依据用户消耗的总电量及总电费可计算得到用户平均电价,具体定义如下:

03.png

对实行两部制电价的用户可进一步将其基本电价考虑在内。对于按变压器容量计费的用户,直接由基本电价与其变压器容量相乘即可;对于按最大需量计算基本电费的用户,计费容量为供电部门安装的最大需量表记录的最大需量。当最大需量低于变压器和不通过变压器的高压电动机容量总和的40%时,则按容量总和40%计算。除基本电费、电度电费外,部分用户还需额外征收功率因数调整电费,以用户从电网吸收的无功功率进行计费。包含这些电费的用户,在计算平均电价时也应加以考虑。用户平均电价水平反映了用户用电成本,与用户经济效益联系密切,反馈该信息能有效提高用户节电的主动性。

1.4.3 考虑多因素的节电策略构建

在开展节电工作中,需要针对用户实际用电情况给出行之有效的节电策略。目前已有的节电策略构建方法往往依赖于实地调研及长期的现场量测,成本较高。本节构建节电策略时,融合电力、气象、经济等多维度分析结果,除考虑用电特性指标外,还将综合上述环境感知、电价成本等多因素。通过决策树算法,结合各指标对应得分以及用户所属行业类别,给出用户所应该执行的节电策略,步骤如图4所示。

38.png

2 节电分析算法业务的并行化

第1节所述分析流程涉及行业、群体、用户多个层级,包含用户档案、气象、负荷、经济、社会等多种数据类型,用户规模可达数10万,数据规模可达TB级别,需要在大数据平台上将第1节的节电分析算法业务并行化实现,以充分利用分布式集群的计算资源,提高分析效率。本文将所述节电分析算法在国网上海市电力公司智能配用电大数据应用系统(简称配用电大数据系统)上进行了实现,并对平台内浦东地区其中10万左右工商业大用户开展了节电分析,时间跨度为2012—2017年,涉及到用户日96点功率曲线、冻结电量、用户档案、电能质量、电价及其他气象、社会、经济数据,分析数据规模在15TB左右。下面介绍系统基本结构及算法业务的并行化实现方式。

2.1 平台整体结构

智能配用电大数据应用系统按数据流向可分为数据来源、数据管理、数据分析、数据展示4部分。平台结合了目前大数据2大主流框架Hadoop与Spark优势,使用Hadoop分布式文件管理系统HDFS及Map-Reduce技术存储多源数据,并建立了NoSQL类型的Hive数据库管理数据。使用内存并行化计算框架Spark内置的SparkR、MLLib组件,能满足实现各类分析算法的并行化要求。使用基于HTML5语言的Web页面展示数据分析结果,并通过EChart、D3等多款JavaScript插件实现数据可视化及动态交互。平台整体结构如图5所示。

39.png

2.2 大数据平台算法业务并行化实现方式

目前已有文献提出了基于Map-Reduce模型的数据挖掘算法并行化方法[8-11],但是Map-Reduce对聚类等迭代计算会消耗大量资源,算法效率不高,并且需要对分布式集群底层具有一定了解,编程设计学习门槛高。针对以上问题,智能配用电大数据应用系统采用Spark内存并行计算框架,克服了Hadoop对迭代运算适用性差的缺点,并且提供了R语言与Apache Spark交互的接口SparkR,可通过R实现对Spark分布式计算引擎的调用,使得SparkR可以充分利用分布式集群的计算资源,高效处理TB级别的数据[22]。

首先,先在GB级别的小样本数据上,使用统计分析常用的R语言编写节电分析程序,以测试算法的有效性及可行性。测试完成后,将单机R语言程序移植到大数据平台上。如图6所示,算法移植主要从以下几个方面进行改进:

40.png

1)分布式数据的读取:和传统数据库结构不同,大数据平台上的数据以分布式的形式分别存储在不同的存储节点上。在R程序中,将原有的

图6 单机版本R程序的移植Fig. 6 Migration of single-machine version R programs

MySQL语句调整为大数据平台Hive组件提供的类SQL语句,实现对分布式数据的读取访问。

2)数据挖掘算法及分析业务的并行化:算法并行是指对某一算法从原理上进行并行化改进,以获得较大的效率提升。例如聚类、降维等算法,并行化后能显著降低算法的复杂度,对分析海量数据尤为必要。R程序通过调用SparkMLlib并行算法库,实现所用聚类等算法的并行化。机器学习与数据挖掘算法库MLlib中内置了通用的分类、回归、聚类、协同过滤、降维等分布式数据挖掘算法,且Spark底层对这些算法进行了深度优化,计算效率极

高[23]。具体的,首先通过SparkR接口将待分析数据转化为分布式数据框,以分布式形式载入Spark内存并行计算框架中,然后调用MLlib组件接口,即可自动实现并行计算。经实测,在服务器集群上对TB级别的数据进行所述聚类、降维分析能保证耗时在1 h以内,大大提高了程序的计算效率,同时SparkR与MLlib组件的结合让研究人员无需重新学习SCALA等编程语言,不必了解分布式集群底层架构,即可实现预期效果。

如果某些业务之间既没有交叉,也没有流程上的先后关系,这些业务之间就是可并行的,如对每个用户计算用电特性指标、开展能效评估等,把可并行的业务分别分配到不同的计算节点进行计算被称为业务并行。本文所述节电分析流程中,具体的并行化改进如图7所示。

3)分析结果的分布式存储:算法在每次计算后都会产生大量的计算结果数据,同样要以分布式形式保存在集群中。由于在分析结果可视化阶段涉及到大量数据的并发读取,为适应计算结果数据频繁读取及不断写入的要求,将分析结果存储在HBase中,和传统关系型数据库相比,HBase是一种高性能分布式数据库,具有易于扩展、支持海量

41.png

图7 数据挖掘算法及分析业务的并行化Fig. 7 Parallel data mining algorithm and analysis service

数据存储及高并发读取的优势。

3 节电分析数据交互及可视化

智能电网的特征是“自动化、信息化、互动化”[11],数据的可视化及交互是实现互动化的主要手段。在大数据环境下,节电分析结果也具有显著的大数据特征,全面、简洁、直观、准确地反映节电分析结果内涵及价值,是数据交互及可视化的关键。

3.1 数据展示结构

目前电力系统中所用到的可视化形式大多基于VTK、Java 3D、Open GL等图形组件。这些应用以客户端/服务器(client/server,C/S)为主要架构,采用面向对象和面向组件的编程方法[24-26]。C/S架构的可视化及交互服务需要在每台客户端上配置可视化环境,安装应用服务,少量部署尚可,但节电分析结果除面向专业人员外,还将面向海量电力用户,在这种应用环境下C/S架构不够灵活轻量。随着以智能手机为代表的移动端设备的兴起,Web技术因为其轻量、灵活、强大、即开即用、无平台移植问题等优势获得了广泛应用。将Web技术用于节电分析服务,用户通过浏览器即可控制分析过程、访问分析结果,且不受平台限制,便于后续向海量电力用户提供特色化的节电服务。智能配用电大数据应用系统在数据交互及可视化方面采用基于Web的SSM(Spring Spring MVC MyBatis)整合框架,在前端网页设计方面采用了HTML5语言,通过EChart、D3等JavaScript图表库实现了数据图表的交互,可视化由数据驱动,图例丰富,功能强大,支持数据拖拽重计算,数据区域漫游等高级功能。

3.2 节电分析可视化功能模块

节电分析可视化效果如图8所示。图中图表均为我国某地区配用电实际数据分析结果,左侧是算法参数设置部分,右侧从宏观到微观展示了行业节电概览、用电群体细分、群体内用户节电潜力走势、单用户节电分析等大数据分析结果。其中参数设置页面用于设置分析时段、聚类等算法参数,点击计算按钮则调用集群中的SparkR程序对所选行业进行分析,计算完成后将分析结果写入HBase数据库中,并在历史计算结果中添加一条记录以便查看。

42.png

图8 整体可视化效果Fig. 8 Ensemble of visualization

3.2.1 行业节电概览

行业节电概览组件用于横向比较不同行业的用户数量及户均节电潜力大小。如图9所示,指针悬停位置显示目标行业的详细信息。可通过点击不同行业可与其他模块产生联动。

43.png

图9 行业节电概览Fig. 9 Overview of trade power saving potential

3.2.2 用电群体聚类结果

本模块展示了1.2节的分析结果,对每个行业采用高维聚类、流形降维等方法,实现了行业用电群体的精细划分。图10中每个圆圈表示一个用电群体,圆圈大小表示群体用户数,属于同一行业的用电群体颜色相同。在行业节电潜力概览界面中点击任一行业,本图将仅显示所选行业的聚类结果,所示用电群体可与群体节电潜力走势模块联动,通过点击群体对应圆圈显示该群体内各用户的节电潜力走势。

3.2.3 群体节电潜力走势

本模块对应1.3节计算结果,可同时显示多个用户节电潜力情况。横轴表示日期,纵轴表示用户,每一行表示一个用户的节电潜力走势,圆圈大小表示节电潜力大小,不同用户采用不同颜色区分。点

44.png

图10 用电群体聚类结果Fig. 10 Result of power consuming group clustering

击图11中某个用户,则在下图中联动显示该用户的用电分析结果。

45.png

图11 群体用户节电潜力走势Fig. 11 Trend t of users’ saving potential in group

3.2.4 单用户节电分析

本模块对应1.4节分析结果,显示群体节电潜力走势中所选用户的分析结果,从用电评价指标、典型用电模式、平均电价水平及环境感知敏感性

4方面分析用户用电行为及节电潜力影响因素,可视化形式如图12—13所示。1)用电评价指标反映了用户峰谷比、负荷率、日均用电等指标在群体中的表现,在图12中以雷达图的形式展示;2)用户用电分析展示了用户日用电曲线及典型用电模式,图13中浅色曲线为该用户全部日用电曲线,加粗突出曲线为聚类后的典型用电模式;3)电价曲线图展示了时段内用户日均电价和行业日均电价,若用户日均电价高于行业日均电价,说明该用户以高于行业平均水平的价格购电,需要优化峰谷用电比例,降低用电成本;4)环境感知南丁格尔图展示了温度、湿度、气压、工作日、节假日等环境因素对用户用电特性的影响大小。最后依据以上4个方面,使用决策树算法从节电策略库中构建合适的节电策略。

46.png

图12 用电评价指标及环境敏感性Fig. 12 Electricity evaluation index and environmental sensitivity

47.png

图13 电价水平及用电行为分析Fig. 13 Electricity price level and analysis of electricity consumption

3.2.5 数据联动

数据联动设置赋予了操作人员感知数据、探索数据、挖掘数据的能力。本文所述节电平台遵循由宏观到微观,层层递进的原则。从行业整体到行业内的用电群体,再到群体内的用户个体,逐渐细化分析粒度。不同层次之间相互联动,类属明确,并且支持点按、拖拽、缩放、聚焦等互动操作。数据联动规则见附录图A4。

4 结论

本文首先介绍了大数据背景下的节电分析流程,包括用电特性高维聚类、综合能效评估、考虑多因素的节电策略构建等步骤,然后在上海电力公司智能配用电大数据应用系统上加以实现。使用SparkR实现了节电算法业务的并行化,设计了基于Web的数据交互及可视化展示形式。实际应用表明,本文所述节电分析方法能有效关联多源数据,并从电价、用户行为、环境感知多角度分析用户用电特性,有针对性地给出用户节电策略。可在大数据平台上实现对海量用户的高效分析,清晰直观地展示分析结果,能有效提高节电服务的精细化水平。

附录A

图A2 物业管理行业典型用电模式Fig. A1 Typical power consuming model of estate management trade

图A2 群体细分结果Fig. A2 Result of group segmentation

图A3 物业管理某用户节电潜力Fig. A3 A consumer’s power-saving potential of estate management trade

表A1 偏最小二乘回归结果Tab. A1 Partial least squares regression results

图A4 数据联动示意图Fig. A4 Diagram of data interaction

致 谢

北京邮电大学硕士研究生陈璞迪和宋礼在节电可视化开发中提供了极大帮助,在此表示由衷感谢。

附录见本刊网络版(http://www.dwjs.com.cn/CN/volumn/current.shtml)。

参考文献

[1]王雁凌,王晶晶,吴京锴,等.能效电厂项目的节电潜力优化模型[J].电网技术,2014,38(4):941-946.WangYanling,WangJingjing,WuJingkai,et al.An electricity-saving potential optimization model of efficiency power plant[J].Power System Technology,2014,38(4):941-946(in Chinese).

[2]冯天瑞,黄瑞艺,石怡理,等.电网企业建筑节电方法及其潜力分析[J].电力需求侧管理,2013,15(5):27-31.FengTianrui,HuangRuiyi,ShiYili,et al.Building power-saving method of power grid enterprises and its potential analysis[J].Power Demand Side Management,2013,15(5):27-31(in Chinese).

[3]Dubois MC,ÅkeBlomsterberg.Energy saving potential and strategies for electric lighting in future North European,low energy office buildings:A literature review[J].Energy & Buildings,2011,43(10):2572-2582.

[4]LiK,LinB.The improvement gap in energy intensity:Analysis of China's thirty provincial regions using the improved DEA(data envelopment analysis) model[J].Energy,2015(84):589-599.

[5]RaoX,WuJ,ZhangZ,et al.Energy efficiency and energy saving potential in China:An analysis based on slacks-based measure model[J].Computers & Industrial Engineering,2012,63(3):578-584.

[6]赵腾,张焰,张东霞.智能配电网大数据应用技术与前景分析[J].电网技术,2014,38(12):3305-3312.ZhaoTeng,ZhangYan,ZhangDongxia.Application technology of big data in smart distribution grid and its prospect analysis[J].Power System Technology,2014,38(12):3305-3312(in Chinese).

[7]赵岩,李磊,刘俊勇,等.上海电网需求侧负荷模式的组合识别模型[J].电网技术,2010,34(1):145-151.ZhaoYan,LiLei,LiuJunyong,et al.Combinational recognition model for demand side load profile in shanghai power grid[J].Power System Technology,2010,34(1):145-151(in Chinese).

[8]王德文,孙志伟.电力用户侧大数据分析与并行负荷预测[J].中国电机工程学报,2015,35(3):527-537.WangDewen,SunZhiwei.Big data analysis and parallel load foreing of electric power user side[J].Proceedings of the CSEE,2015,35(3):527-537(in Chinese).

[9]丁坚勇,周凯,田世明,等.基于大数据技术的重要用户供电安全分析[J].电网技术,2016,40(8):2491-2495.DingJianyong,ZhouKai,TianShiming,et al.Big data technology based important user power supply security analysis[J].Power System Technology,2016,40(8):2491-2495(in Chinese).

[10]王德文,周青.一种电力设备状态监测大数据的分布式联机分析处理方法[J].中国电机工程学报,2016,36(19):5111-5121.WangDewen,ZhouQing.A method of distributed on-line analytical processing of status monitoring big data of electric power equipment[J].Proceedings of the CSEE,2016,36(19):5111-5121(in Chinese).

[11]丁杰,奚后玮,韩海韵,等.面向智能电网的数据密集型云存储策略[J].电力系统自动化,2012,36(12):66-70.DingJie,XiHouwei,HanHaiyun,et al.A smart grid-oriented data placement strategy for data-intensive cloud environment[J].Automation of Electric Power Systems,2012,36(12):66-70(in Chinese).

[12]中国电机工程学会信息化专委会.中国电力大数据发展白皮书[S].北京:中国电力出版社,2013.

[13]赵莉,候兴哲,胡君,等.基于改进K-Means算法的海量智能用电数据分析[J].电网技术,2014,38(10):2715-2720.ZhaoLi,HouXingzhe,HuJun,et al.Improved K-Means algorithm based analysis on massive data of intelligent power utilization[J].Power System Technology,2014,38(10):2715-2720(in Chinese).

[14]朱文俊,王毅,罗敏,等.面向海量用户用电特性感知的分布式聚类算法[J].电力系统自动化,2016,40(12):21-27.ZhuWenjun,WangYi,LuoMin,et al.Distributed clustering algorithm for awareness of electricity consumption acteristics of massive consumers[J].Automation of Electric Power Systems,2016,40(12):21-27(in Chinese).

[15]肖琪.基于优化K-means算法的电力负荷分类研究[D].大连:大连理工大学,2015.

[16]周凯.大数据背景下线损和用电特性分析研究[D].天津:天津大学,2016.

[17]赵腾,王林童,张焰,等.采用互信息与随机森林算法的用户用电关联因素辨识及用电量预测方法[J].中国电机工程学报,2016,36(3):604-614.ZhaoTeng,WangLintong,ZhangYan,et al.Relation factor identification of electricity consumption behavior of users and electricity demand foreing based on mutual information and random forests[J].Proceedings of the CSEE,2016,36(3):604-614(in Chinese).

[18]PérezgonzálezA,VergaraM,Sanchobru JL,et al.Visualizing data using t-SNE[J].Journal of Machine Learning Research,2017,9(2605):2579-2605.

[19]李蕊,李跃,徐浩,等.基于层次分析法和专家经验的重要电力用户典型供电模式评估[J].电网技术,2014,38(9):2336-2341.LiRui,LiYue,XuHao,et al.Assessment on typical power supply mode for important power consumers based on analytical hierarchy process and expert experience[J].Power System Technology,2014,38(9):2336-2341(in Chinese).

[20]罗耀明,毛李帆,姚建刚,等.电力用户综合能效评估模型[J].电力系统及其自动化学报,2011,23(5):104-109.LuoYaoming,MaoLifan,YaoJiangang,et al.Evaluation model of integrated energy efficiency for power users[J].Proceedings of the CSU-EPSA,2011,23(5):104-109(in Chinese).

[21]毛李帆,江岳春,龙瑞华,等.基于偏最小二乘回归分析的中长期电力负荷预测[J].电网技术,2008,32(19):71-77.MaoLifan,JiangYuechun,LongRuihua,et al.Medium- and long- term load foreing based on partial least squares regression analysis[J].Power System Technology,2008,32(19):71-77(in Chinese).

[22]VenkataramanS,GhodsiA,GhodsiA,et al.SparkR:scaling R programs with spark[C]//International Conference on Management of Data.ACM,2016:1099-1104.

[23]MengX,BradleyJ,YavuzB,et al.MLlib:machine learning in apache spark[J].Journal of Machine Learning Research,2016,17(1):1235-1241.

[24]沈国辉,佘东香,孙湃,等.电力系统可视化技术研究及应用[J].电网技术,2009,33(17):31-36.ShenGuohui,SheDongxiang,SunPai,et al.Research and application of power system visualization technology[J].Power System Technology,2009,33(17):31-36(in Chinese).

[25]杨德尚,袁荣湘,李启旺,等.可视化黑启动决策支持软件开发研究[J].电力系统保护与控制,2010,38(5):97-101.YangDeshang,YuanRongxiang,LiQiwang,et al.Visual black startup decision support software development research[J].Power System Protection and Control,2010,38(5):97-101(in Chinese).

[26]赖晓文,陈启鑫,夏清,等.基于SVG技术的电力系统可视化平台集成与方法库开发[J].电力系统自动化,2012,36(16):76-81.LaiXiaowen,ChenQixin,XiaQing,et al.Development of integrated and method base for power system visualization platform based on SVG technology[J].Automation of Electric Power Systems,2012,36(16):76-81(in Chinese).

原标题:用户节电的大数据分析及应用

特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。

凡来源注明北极星*网的内容为北极星原创,转载需获授权。
展开全文
打开北极星学社APP,阅读体验更佳
2
收藏
投稿

打开北极星学社APP查看更多相关报道

今日
本周
本月
新闻排行榜

打开北极星学社APP,阅读体验更佳