主动配电网全景信息展示系统集成了若干分散系统,对数据的收集、整合、分析挖掘将形成配网监视、控制的信息支撑。本文分析数据挖掘的体系结构、流程、特征提取方法,并将其应用到主动配电网全景信息展示系统中,构建出相应的信息展示指标体系,并通过工程实践验证其可行性。0引言主动配电网通过分布式

首页 > 技术 > 正文

【关注】基于数据挖掘的主动配电网全景信息展示系统

2015-09-17 06:41 来源:供用电杂志 

主动配电网全景信息展示系统集成了若干分散系统,对数据的收集、整合、分析挖掘将形成配网监视、控制的信息支撑。本文分析数据挖掘的体系结构、流程、特征提取方法,并将其应用到主动配电网全景信息展示系统中,构建出相应的信息展示指标体系,并通过工程实践验证其可行性。

0引言

主动配电网通过分布式智能设备、通信系统和自动控制系统,对配电网设备的运行状况进行实时监控,通过数据收集、整合和分析挖掘,实现电网各成员之间的无缝连接及实时互动,达到对整个电网运行的优化管理[1-2]。配电自动化系统涉及专业多、覆盖面大、系统接入设备型号繁多、通道形式多样、相关技术标准尚未统一。配电网结构调整和设备改造频繁、图形参数维护工作量巨大[3-4]。

配电网设备用户种类繁多、特性存在差异大、运行数据繁多,需要有效整合。在电网统一模型的基础上,需要对不同系统的模型、图形以及实时和非实时数据进行整合处理,提供各应用系统数据交换和共享的平台,实现数据、模型、图形管理,提供统一的信息服务和开放的集成开发环境,实现综合分析和数据挖掘功能。文献[5-7]介绍了配电网信息平台的关键技术,文献[8]研究了数据挖掘技术在电网调度事故决策中的应用。

本文介绍主动配电网全景信息展示系统的数据来源,对包括基于地理信息系统的配电自动化系统的实时与历史数据进行分析,研究数据挖掘的关键技术,解决配电网调度管理粗放、故障快速处理能力不足。通过某实际工程系统中的实施,对主动配电网的建设具有借鉴意义。

1数据挖掘的体系结构

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、事先不知道的,但又是潜在有用的信息和知识的过程[9]。数据挖掘的体系结构见图1。

第1层是数据源,包括数据库和数据仓库。数据挖掘不一定要建立在数据仓库的基础上,但如果数据挖掘与数据仓库协同工作,将大大提高数据挖掘的效率;第2层是数据挖掘工具,利用数据挖掘方法分析数据库中的数据,包括关联分析、序列模式分析、分类分析、聚类分析等;第3层是用户界面,将获取的信息以便于用户理解和观察的方式反映给用户,可以使用可视化工具。知识库存放专业领域知识,用于指导数据准备或数据挖掘结果的评估。

2功能设计

1数据挖掘的流程

数据挖掘的过程就像从矿山中采矿一样,采矿必须首先确定金矿所在。同样地,从实际应用的角度出发,整个数据挖掘的过程都是必须建立在对挖掘对象(即所研究领域的大量数据)的深刻理解上。对象不同所采用的挖掘技术也不同。因此,在数据挖掘之前就应该熟悉相关对象的背景知识,明确数据挖掘的目的,同时了解数据挖掘相关领域的情况,从而将挖掘技术和专业知识有机地结合在一起,对挖掘对象的了解贯穿整个数据挖掘过程。

数据准备是数据挖掘的第一个阶段,也是非常重要的一个阶段。数据准备的好坏将影响到数据挖掘的效率和准确度,以及挖掘模式的有效性。这个阶段又可细分为数据集成、数据选择、数据预处理和数据转换4个步骤。

1)数据集成是将多文件或多数据库运行环境中的数据进行合并处理,解决语意模糊性,处理数据中的遗漏和清洗脏数据等。

2)数据选择就是根据用户要求,利用一些数据库操作对数据进行处理,从数据中提取出需要挖掘的数据集合。

3)数据预处理就是对上述数据进行再加工,检查数据的完整性和一致性,对其中的噪声数据进行处理,对丢失的数据利用统计方法进行填补,为进一步的分析做准备,并确定将要进行的挖掘操作的类型。之后,根据数据挖掘的目标,通过投影等降维处理技术减少待处理的数据量。

4)数据转换就是根据数据挖掘的需要,进行离散值数据与连续值数据之间的相互转换、数据值的分组分类、数据项之间的计算组合等操作。

数据挖掘是运用选定的数据挖掘方法,从数据中提取用户需要的知识。数据挖掘常用的分析方法有:关联分析、序列模式分析、分类分析和聚类分析。在本项目的实施中主要采用了统计分析方法、决策树方法、神经网络方法、遗传算法和可视化技术等。

解释评估是根据最终用户的决策目的对提取的知识进行分析,把最有价值的信息区分出来,提交给用户。在这个过程中,不仅要把知识以能被人理解的方式表达出来,还要对其进行有效性评价,如果不能满足用户要求,则应重复上述数据挖掘过程。

 

2.2模式识别模式

在数据挖掘中有大量的模式识别模型处理。模式识别模型由预处理、指标计算、参数选择、类型识别与解释、规则挖掘等子模块组成,模块组合见图3。图中箭头表示模型计算数据流。初始数据集为原始负荷采集数据,参数选择模块包含算法及其参数的人工选择,在模型各子模块中采用了失真数据识别与修正、数据归一化处理、数据降维与可视化聚类、聚类评判指标等算法。

交叠空间的数据提取

主动配电网中对象属性规模庞大,有宏观的全网负载水平,也有微观的设备控制参数增益。因此在主动配电网的全景信息展示系统中不仅需要考虑与现象相关的所有影响因素(描述属性),同时也需要构建全属性维度的描述空间,掌握其属性的空间分布特性。采用m维属性空间描述n维系统,其中m

1)辅助调度员或监控系统对电网运行状态进行多指标联合观测,如果系统运行在交叠空间中,即发出预警信号,并提供危险程度信息和离开交叠空间的安全引导策略,在紧急情况下快速调整系统状态点到安全空间区域。

2)发现新的有效的安全控制手段,以有效降低交叠空间在描述空间中所占比例为目标,扩展或改进描述空间的属性集,将新的属性集作为控制对象植入自动控制装置,减小系统状态点落入交叠空间进而使事件不可判定的概率。

3)结合其他数学工具提出新的分析方法和控制技术。交叠空间的应用思路流程图见图4,展示了电力系统交叠空间的应用思路。

模式识别模型接口

数据挖掘是一个利用各种分析方法和分析工具在大规模海量数据中建立模型和发现数据间关系的过程,这些模型和关系可以用来做出决策和预测。支持大规模数据分析的方法和过程,选择或者建立一种适合数据挖掘应用的数据环境是数据挖掘的重要前提。各类模型的数据接口是一项重要的工作。基于模式识别组合模型算法流程与接口的流程见图5。

3工程实例

在主动配电网全景信息展示系统中接入配电管理信息系统,包括配电自动化系统、调度自动化系统、电网气象信息系统、电能质量监测管理系统、生产管理系统、地理信息系统、用电信息采集系统、配电变压器负荷监测系统、负荷控制系统、营销业务管理系统、ERP系统、95598客服系统、经济社会类数据等数据源。它包含了大量的半结构化/非结构化数据,其信息服务支撑体系见图6。

 

根据实际需求形成的主动配电网全景信息展示系统的指标体系见图7,其中的电量分解指标效果见图8。

图8 电量分解指标体系效果图

4结语

随着主动配电网的发展,需要集成各分散系统的信息,规范数据类型,有效的数据挖掘能对不同类型、不同型号、不同状态的设备进行故障发生的预测分析,能对电网的运行数据指标体系进行分析,从而为电网运检的预防性防护措施提供支撑,为电网安全运行、智能电网自愈提供保障。

电力信息化的建设,构建全景信息展示系统,搭建在企业数据共享的平台下获取电力企业生产数据、管理数据、地形地貌数据、水资源数据等有效数据,能够挖掘出准确的、有价值的数据,能够为管理效益、决策能力提升提供有效帮助。数据挖掘手段、信息表达方式的不断提高可推动主动配电网的发展,进一步提升设备运行管理水平,为运行检修科学决策提供可靠的数据依据,具有巨大的经济价值和社会效益。(刘俊勇 黄媛 刘友波 魏震波 陆宏治 邹时容)

原标题:基于数据挖掘的主动配电网全景信息展示系统

特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。

凡来源注明北极星*网的内容为北极星原创,转载需获授权。
展开全文
打开北极星学社APP,阅读体验更佳
2
收藏
投稿

打开北极星学社APP查看更多相关报道

今日
本周
本月
新闻排行榜

打开北极星学社APP,阅读体验更佳