中国电力科学研究院的研究人员刘科研、盛万兴等,在2015年第2期《中国电机工程学报》上撰文,智能配电网中存在大量异构多源的数据,其中的数据规模和特点符合大数据的各项特征。首先总结配电网大数据的来源和特征,然后从智能配电网中的应用场景出发,分别从配电网负荷预测、运行状态评估与预警、电能质量监测和评估、基于配电网数据融合的停电优化等方面进行分析。
从不同系统和不同数据结构角度,对多源数据融合中的不良数据辨识进行重点分析,同时还归纳了配电网大数据关联模型建模方法和配电网大数据分析手段。通过在配电网中运行大数据的分析技术,能够为智能配电网开展分析提供强有力的计算和分析条件,大数据的分析结果可为配电网规划和安全运行提供数据支撑,也可有效提升配电网各类资产健康水平。
在信息技术中,大数据是指无法在一定时间内,用常规的工具软件(如现有数据库管理工具或数据处理应用)对其内容进行抓取、管理、存储、搜索、共享、分析和可视化处理的由数量巨大、结构复杂、类型众多数据构成的大型复杂数据集合[1-2]。
相关阅读:面向智能电网应用的电力大数据关键技术
大数据具有4V特点,即高容量(Volume)、快速性(Velocity)、多样性(Variety)和价值密度低(Value)。大数据带来的挑战在于它的实时处理,而数据本身也从结构性数据转向了非结构性数据,因此使用关系数据库对大数据进行处理是非常困难的。
配电网处于电力系统的末端,具有地域分布广、电网规模大、设备种类多、网络连接多样、运行方式多变等鲜明特点。随着城镇化建设和用电需求的增长,配电网一直在不断地改造和扩建,其规模也不断扩大,国网公司系统内大多数县级以上配电网的规模都已达到百条馈线以上,一些中、大型城市的中压馈线已达到或超过千条。
随着配电自动化、用电信息采集等应用系统的推广应用,对于有千条馈线的大规模配电网,配电网中会产生指数级增长的海量异构、多态的数据,数据集合的大小可达到当今信息学界所关注的大数据级别。
此外,大规模配电网还具有其特有的特征:1)数据采集多,每个采集点采集相对固定类别的数据,且分布在各个电压等级内;2)不同采集点的采样尺度不同,数据断面不同;3)数据不健全,数据采集存在误差和漏传;4)数据分布在不同的应用系统中。
含有包括光伏发电、风电、燃气轮机等分布式电源(distributed generator,DG)的配电网即有源配电网,分布式电源的不断渗透给大规模配电网传统的分析与计算带来更大的挑战。
分布式电源接入电网后,向电网调度机构提供的信息至少应当包括:1)电源并网状态、有功和无功输出、发电量;2)电源并网点母线电压、频率和注入电力系统的有功功率、无功功率;3)变压器分接头档位、断路器和隔离开关状态。
因此,分布式电源接入后,在原已规模很大的配电网数据采集中新增了一组需采集的数据项,同时也会恶化配电网数据采集的非健全性和不确定性。
鉴于大数据在电力系统的应用场景越来越多,有必要对大数据在配电网的应用场景和目标进行分析与总结,为大数据技术在智能电网中的应用提供有益的参考。
1 配电网大数据的来源和特征
智能配用电大数据应用具备丰富的数据源,现在大多数地市拥有多个配电管理系统,包括配电自动化系统、调度自动化系统、电网气象信息系统、电能质量监测管理系统、生产管理系统、地理信息系统、用电信息采集系统、配变负荷监测系统、负荷控制系统、营销业务管理系统、ERP系统、95598客服系统、经济社会类数据等数据源,这些数据源的总体状况如表1所示。
表1 典型配电系统数据源
这些数据源涵盖了调度、运检、营销等多个管理业务,以及绝大部分110kV及以下多电压等级的电网监控和采集信息。从数据源类型来讲,智能配用电大数据应用的数据源类型丰富,覆盖配变、配电变电站、配电开关站、电表、电能质量等配用电自动化和信息化数据、用户数据和社会经济等数据。
2 配电网典型大数据场景分析
2.1 面向有源配电网规划的负荷预测
随着配电网信息化的快速发展和电力需求影响因素的逐渐增多,用电预测的大数据特征日益凸显,传统的用电预测方法已经不再适用。由于智能预测方法具备良好的非线性拟合能力,因此近年来用电预测领域出现了大量的研究成果,遗传算法、粒子群算法、支持向量机和人工神经网络等智能预测算法开始广泛地应用于用电预测中。
传统的用电负荷预测,受限于较窄的数据采集渠道或较低的数据集成、存储和处理能力,使得研究人员难以从其中挖掘出更有价值的信息。通过将体量更大、类型更多的电力大数据作为分析样本可以实现对电力负荷的时间分布和空间分布预测,为规划设计、电网运行调度提供依据,提升决策的准确性和有效性。
2.2 配电网运行状态评估与预警
基于大数据技术的配电网运行状态评估与预
警研究内容如图1 所示,包括以下方面:
图1 有源配电网运行状态评估和风险预警
1)对配电网进行安全性评价,如电力系统的频率、节点电压水平、主变和线路负载率等;
2)对配电网的供电能力进行评价,如容载比、线路间负荷转移能力等。当供电能力不能满足负荷需求时,根据负荷重要程度、产生的经济社会效益以及历史电压负荷情况,进行甩负荷;
3)对配电网可靠性和供电质量进行评价,如负荷点故障率、系统平均停电频率、系统平均停电时间、电压合格率、电压波动与闪变、三相不平衡度、波形畸变率、电压偏移、频率偏差等;
4)对配电网经济性进行评价,如线损率和设备利用效率等。
通过计算风险指标,判断出所面临风险的类型;预测从现在起未来一段时间内配电网所面临的风险情况;根据风险类型辨识结果,生成相应的预防控制方案,供调度决策人员参考;可以对突发性的风险和累积性风险进行准确辨识、定位、类型判断、生成预防控制方案等;依据对多源异构的数据分析,将风险准确定位到局部,进一步对全网或局部电网的风险状况进行集中判断、定位以及预防控制。
2.3 有源配电网电能质量监测和评估
随着分布式电源不断地接入配电网,逐步形成了小、中、大规模的有源配电网。伴随着分布式电源的功率波动,配电网中的电能质量经受着较大的冲击。通过收集配电网中的运行数据、负荷数据、分布式电源运行等数据,能够开展配电网中的电能质量分析和评估研究,从而得出精细化的配电网网架和无功源的调节方案等。有源配电网电能质量监测和评估示意图如图2所示。
图2 有源配电网电能质量监测和评估示意图
基于大数据的有源配电网电能质量监测和评估包括以下方面。
1)有源配电网电能质量分析与监测。
电网规模的不断扩大以及分布式电源的不断接入,配电网中运行数据、负荷数据、分布式电源运行等数据逐渐增多,电能质量分析的大数据特征日益明显,传统电能质量分析方法在电能质量的消噪、特征提取、扰动分类和参数估计等方面难以完全解决问题。面对出现的电能质量问题,近年来产生了许多综合分析法[3-4]。
但是,基于传统电能质量分析方法的电能质量监测装置面临性能差、精度低、智能化程度低等问题,需研究高性能的电能质量分析方法,开发实时在线的电能质量监测系统。电能质量监测系统集通信、测量、分析和管理等诸多功能于一体,能为电力企业和用户提供供电质量的基本信息,实现有源配电网电能质量全面、准确、有效地监测。同时考虑到经济性,有源配电网中监测终端的最优布点也是亟需解决的问题。
2)有源配电网电能质量评估。
有源配电网电能质量的评估是对有源配电网运行水平和电力供应能力的综合评价,是约束、督促电力公司与电力用户共同维护公共电网电能质量环境的基础,同时也是实施质量治理与控制的依据、检验治理与控制效果的工具[5]。
随着分布式电源越来越多的接入配电网,用户对电能质量的要求越来越高,传统的电能质量评估方法面临计算性能降低、耗时长、精度低等问题,如何使电能质量的评估合理、客观、准确是电力企业面临的严峻考验。
而且,大规模的结构化数据和非结构化数据的加入,将为电能质量评估提供新的研究途径,制定合理的有源配电网电能质量评估指标,提高电能质量评估的准确性,深度挖掘电能质量监测系统采集到的数据信息,揭示由于之前分析成本太高而忽略的信息,为电力企业以及用户提供诸如网架结构分析、无功源配置方案合理性分析、敏感负荷安装位置分析、监测点配置方案等高附加值服务,这些服务将有利于电网的安全、稳定和经济运行。
3)有源配电网电能质量诊断与治理。
为了满足较高电能质量的要求,及时正确地对影响电能质量的各种异常运行状态做出诊断,找出电能质量干扰源,并预防或消除,从而避免故障的扩大,是有源配电网面临的又一个难题。
鉴于分布式电源可以看作一种向配电馈线注入谐波的非线性负荷,而分布式电源的投切也会引起电压波动,分布式电源的接入无疑会在一定程度上加重对电能质量的扰动。传统的电能质量扰动定位方法都存在一定的适用环境与限制条件,且仅仅考虑一种定位方法得出的定位结果可信度往往不高。
通过将体量更大、类型更多的电力大数据作为分析样本,为电能质量扰动定位提供详细的研究思路,提高电能质量扰动定位的准确性,寻找出网架结构中的薄弱环节,制定精细化的配电网网架和无功源调节方案,改善电能质量,对电网的经济运行具有重要意义。
2.4 基于配电网数据融合的停电优化
配电网停电优化是建立在配电网调度自动化系统、配电自动化系统、用电信息采集系统、配网设备管理系统、配电设备检修管理系统、电网图形及地理图形信息和营销管理系统等的基础上,综合分析配电网运行的实时信息、设备检修信息等,以找出最终的最优停电方案。
计划停电管理根据计划停电(包括检修和限电等)的要求,进行系统模拟,以最小的停电范围、最短的停电时间、最小的停电损失、最小的停电用户来确定停电设备,通过屏幕显示停电区域,列出停电的用户名单,打印用户停电通知书等等。采用传统技术在处理时存在计算速度慢、计算周期长、扩展性差等缺点。
为了更加准确地计算配网停电损失,降低停电影响需要利用多个业务系统的海量数据进行联合分析和数据挖掘。
基于大数据技术的配电网停电优化包括:1)停电信息分类,基于调度、营销、配网贯通的海量数据对停电信息数据进行整理与分类;2)停电预警,对设备故障可能导致停电进行预警;3)配电网停电计划制定,采用大数据技术制定合理的停电计划,完善配网停电优化分析系统。
3 配电网多源数据融合中的不良数据辨识
3.1 不良数据检测与辨识方法
不良数据检测是指判断某次量测采样中是否存在不良数据。不良数据辨识是指在发现某次量测采样中存在不良数据后,确定哪个(或哪些)量测是不良数据。不良数据的处理已经成为一个热门课题,目前国内外已经提出多种不良数据检测与辨识的方法,大致分为以下2 类:
1)传统的不良数据检测方法包括目标函数极值检测法、加权残差法、检测法或标准化残差检测法、量测量突变检测法等。传统的不良数据辨识方法主要有残差搜索法、非二次准则法、零残差法、估计辨识法等;
2)相对传统的一些新理论和新方法主要有基于数据挖掘的模糊数学法、神经网络法、聚类分析法、间隙统计法等。这些方法大多针对传统配电网比较简单的小规模结构化数据。随着智能配电网规模的不断扩大、分布式电源的接入以及网络技术在配电系统中的广泛应用,对于配电网中达到大数据级别的不良数据的检测与辨识,传统方法很难达到处理需求。
3.2 基于多源数据的不良数据辨识方法
根据配电网大数据多源、多渠道的特点,可基于不同来源的数据进行互校核,实现不良数据的检测与辨识,包括电度量和量测量的互校核、不同数据系统间的互校核方法、不同结构数据的互校核等,如图3所示。
图3 基于多源数据融合的不良数据辨识方法
1)基于电度量与量测量互校核的不良数据检测方法。(略)
2)基于不同系统间数据互校核的不良数据检测方法。
配电网多源数据按获得来源分,可分为来自不同系统的数据,来自不同系统间的数据可以进行互校核。如可结合配电网管理信息系统、生产管理系统的信息以及低压台区互联信息,确定配变用电类型,按照不同行业需量系数和典型日负荷曲线可拟合出该配变负荷曲线。
3)基于不同结构数据互校核的不良数据检测方法。
配电网中含有结构化数据、非结构化数据、半结构化数据,但是不同类型的数据可能包含相同的信息量,如某一线路的长度可由地理信息系统中的非结构化图形数据获得,也可从生产管理系统中的结构化数据获得,通过不同类型的数据进行互校核,可实现不良数据的辨识。
配电网中不同的数据源为配电网研究对象提供了多角度、多时间、多维度的数据描述,为了通过大数据分析充分挖掘有用信息,需要建立数据之间的关系数学模型。
4 配电网大数据关联模型建模
4.1 配电网数据特征化
配电网中的研究对象一般使用类进行描述,这种描述可以通过数据特征化得到,数据特征化是目标类数据的一般特性或特征的汇总。特征是一个数据字段,表示数据对象的一个特征[6]。不同配电网研究对象有不同的属性,不同的属性有不同的数据类型,一个属性的类型由该属性可能具有的值的集合决定。
4.2 配电网数据邻近性模型
数据的相似性和相异性都称为邻近性,配电网数据邻近性模型具有广泛的应用。例如,同一个负荷可能在不同的应用系统中有着不同的记录,为了正确高效地进行数据分析,需要在数据集成时将多条记录合并为一条记录,因此需要对多条记录的邻近性进行计算分析。
再如,需要定量描述投运时间对设备性能的影响。同时,邻近性模型还是进行分类、聚类分析、离群点分析等深入研究的数据基础。
4.3 配电网数据关联模型
关联规则由Agrawal、Imielinski和Swami提出,是数据中一种简单但很实用的规则[7]。配电网故障、状态与原因之间存在关联关系,发现故障属性间的关联特性可以更好地对设备进行故障监测与诊断。
如分析配电网参数和暂态稳定性之间的关联性,判断发生故障时系统失稳的概率;如分析系统节点电压变化特性与故障之间的关系,找出系统中最为敏感的节点;如寻找特定地点谐波电流与其他地点电压之间的关联度,确定谐波源位置、特征及处理方法。
也可在电力营销和负荷管理中引入关联分析,以指导供电公司制定合理的营销策略,如在配网规划中,分析城市用电量与GDP 增长率、第二产业比重、中心性等级、行政级别、气候类型等因素之间的关联关系。
5 配电网大数据分析方法和手段
5.1 配电网数据特征聚类
聚类可用于将数据分割成多个类或子集,在聚类分析中类的数量是未知的。常见的聚类方法有划分聚类法、层次聚类法、网格聚类法、基于模型的聚类法以及智能聚类法等。根据不同聚类方法的适用范围及配电网大数据的特征,通过研究基于配电网时空特性的数据聚类方法,能够提出处理配电网时空特性的数据聚类解决方案。
从配电网调度系统和负荷监测中提取不同区域、不同类型的用户负荷曲线,进行负荷特性聚类分析,为电力公司营销和负荷管理提供依据,是近几年电力系统聚类分析的研究热点[8-9]。通过对负荷曲线的聚类,可以作为负荷预测和电价预测的预处理过程;通过分析配电网线路和设备故障信息,形成具有相似变化的曲线簇,可更好地估计和抑制故障带来的影响。
5.2 配电网数据特征分类
分类是通过训练产生的分类函数或分类模型将数据对象映射到2 个或多个给定类别的方法[10-12]。从机器学习的观点,分类分析是一种有指导的学习,即其训练样本的分类属性(类标号)的值是已知的,通过学习过程形成数据对象与类标示间对应的知识,这类知识也可称为分类规则。
分类通过已训练好的模型或分类规则来预测、标记未知的数据类。分类方法包括决策树归纳法、K最近邻法、向量空间模型法、贝叶斯分类法、支持向量机模糊分类及神经网络法等。在配电网配电变压器故障识别和诊断中,可以通过贝叶斯分类方法将变压器故障分类为内部或外部的接地和短路故障;也可以用神经网络来识别包括高温、低能和高能状态等故障类型。
5.3 配电网大数据快速分析技术路线
数据挖掘技术的选择由相应需要解决的业务问题来决定。要解决一个业务问题,在一个数据挖掘的完整流程中,需要同时利用多种数据挖掘方法。例如在数据预处理阶段,可以通过统计性描述方法对数据的本质、质量进行探索和分析,利用无量纲化的模型对数据进行标准化处理,也可以用聚类分析对临群点进行探索等。
基于配电网大数据聚类与分类技术,研究面向大规模配电网大数据的快速数据分析与处理技术,其技术路线如图4所示。
图4 配电网时空特性的快速数据处理方法
5.4 数据密集型计算手段
目前分布式并行计算技术是数据密集型计算的主要手段。由于大数据的数据量和分布式的特点,使得传统的数据管理技术难以胜任这种海量数据。很多企业开始想方设法把大数据存储起来,不断地尝试新的大数据存储架构、研究大数据分析方法技术。
目前,在分布式并行计算与存储的很多研究和应用中,Hadoop的分布式并行处理应用的比较多,比如互联网网页分析和大数据统计挖掘等。电力系统的优化分析方法大多是计算任务/数据密集型的,所以可依靠Hadoop较容易地开展分布式并行方面的计算和研究。
基于Hadoop的分布式并行计算技术在国内电力行业中的应用研究还处于探索阶段,研究内容主要集中在系统构想、实现思路和前景展望等方面[13-17]。在国外,基于Hadoop的分布式并行计算应用目前已用于海量数据的存储和简单处理,已有实现并运行的实际系统[18-21]。
分布式并行计算技术能够为大规模复杂配电网分析计算提供强大的支撑,并能为供电企业和用户提供大量的高附加值服务,这些增值服务将有利于电网安全监测与控制(包括故障预警与处理、供电与电力调度决策支持和更准确的用电量预测)、客户用电行为分析与客户细分、电力企业精细化运营管理、更科学的需求侧管理等。
6 结论与展望
随着大数据时代的到来及大数据应用技术的发展,为充分利用现有电网运行数据和气象环境数据进行设备故障预测成为可能。
通过集成各分散系统的信息,规范数据类型,形成丰富的、同质的大数据样本,对不同类型、不同型号、不同状态的设备进行故障发生可能性预测,可为电网运检采取针对性的防护措施提供支撑,为电网安全运行、智能电网自愈提供保障。
电力信息化建设利用大数据技术,在企业数据共享的平台下获取电力企业生产数据、管理数据、地形地貌数据、水资源数据等有效数据,能够提炼准确的、有价值的数据,能够为管理效益、决策能力提升提供有效帮助。
特别是在运行检修基础数据不断积累的前提下,利用大数据分析技术,能对检修工作进行有效预测和数据支持,可进一步提升设备运行管理水平,为运行检修科学决策提供可靠的数据依据,具有巨大的经济价值和社会效益。
相关阅读:
扫描关注北极星电力网微信