摘要:电力大数据下的数据挖掘技术应用贯穿于发、输、变、配、用各个环节,介绍了分类分析、关联分析、聚类分析和异常检测等智能算法在输电系统雷电预测、设备运行状态分析、配电系统运行故障预警及风险预测、用户用电行为特性聚类、电力市场行为分析、电力市场中负荷及电价预测等的应用。数据挖掘技术可显著提升电网运行效益,是未来智能电网发展的核心技术之一。
0 引言
倡导“全球能源互联网”,加快智能电网的建设是中国电力行业未来的发展目标,而大区域、宽领域的电能互联离不开电力设备的信息化。随着电力系统“源一网一荷”信息化建设的不断深入,近年来投入了许多先进设备及系统,例如智能变电站、配电SCADA系统、用户能源管理系统等。这些数字化平台在提高运行自动化、智能化的同时会产生大量数据,并且这些数据的数量和种类正呈现快速增长的态势。
来自电网内部及外部的大量数据不仅涵盖系统内的广域监测系统(WAMS)、能量管理系统(EMS)等所采集的电气量,也包含设备层的物理数据、气象数据等非电气参数,这些数据的相互关系错综复杂,如何利用这些数据并用于电力系统运行成为难点之一。
1 大数据和数据挖掘技术概述
1.1数据挖掘技术的概念
数据挖掘(Data mining)是指从海量数据中获取隐藏的、未知的但又有潜在价值的信息的过程。20世纪80年代,数据挖掘技术兴起,主要解决传统数据库的问题。进入大数据时代,数据库中存着种类繁多的数据,这些数据数量庞大,有用和无用的数据掺杂在一起,无法分辨,形成“数据爆炸而知识贫乏”的现象。数据挖掘技术是发现数据隐藏价值的关键。
1.2大数据下的数据挖掘技术
与传统的数据集合相比,大数据不仅体量更大,还包含大量非结构化数据,需要更多的实时分析。有分析师对数据的增长模式定义了三种属性,即:Volume(数量)、Velocity(速度)、Variety(种类),也被称为“3V s”模型,如图1所示。该模型可以反映大数据的基本特征:规模庞大的数据,为保证数据时效性而采用的快速数据收集分析技术,以及包含文本、网页等半结构和非结构化的多样数据。
在大数据背景下的数据挖掘需要面对体量更为巨大的数据和更高的速度要求,所以必须结合计算机和智能算法来提高数据处理效率。计算机领域中的机器学习算法、模式识别算法以及人工智能算法改进后都可用于数据挖掘,主要方法有分类分析、关联分析、聚类分析和异常检测等。
1.3大数据及数据挖掘技术在电力系统中的应用
电力系统作为人类社会最重要的人造系统之一,具有规模庞大、分布广泛、数据丰富的特点,被认为是大数据的典型代表。在2013年发布的《中国电力大数据发展白皮书》中,提出了“电力大数据”的概念,在原有的“3V s”基础上,补充了“3E s”的定义来体现电力大数据的特殊性,分别是:Energy(能量)、Empathy(数据共情)、Exchange(数据交互),更好地反映了电力行业大数据的特征,如图2所示。
电力大数据下的数据挖掘应用场合多种多样,贯穿了发、输、变、配、用各个环节,并且智能电网的建设使得其应用范围不断得到拓展:输电网络中的雷电分析、设备监测,配电网络的用户特性辨识,电力市场中的电价预测等都需要进行数据挖掘。
2 数据挖掘技术在输电系统中的应用
输电系统作为电力网的主干网架,具有规模大、结构复杂的特点,输电系统产生的大规模数据对于输电网络的安全运行具有重要的分析价值。下面以输电线路的雷电活动时空分布分析和电力系统设备状态监测为例,阐述数据挖掘技术在输电系统中的应用。
2. 1输电线路雷电活动时空分布
雷电活动引起的电力系统故障包括设备直接损失、线路跳闸及引起的局部停电,对雷电活动进行分析,得出其时空分布特点对于输电线路的规划和安全运行具有重要价值。采用统计学方法处理数据对于人力和时间的消耗过大,且结果也不理想。于是有学者利用数据挖掘技术分析雷电数据并进一步概括其时空分布特性。
雷电定位系统一般利用时差法和磁定向法获取雷击位置的二维数据(经纬度),再借助等高线程图获得地闪点的高度信息,从而将数据处理为三维数据。雷电具有多项指标,包括雷电类型、日变化特征、二维空间分布、海拔高度分布和雷电强度等,这些数据均可以通过数据挖掘进行分析。采用以DataCruncher为代表的数据处理软件,利用神经网络算法可得到模型数据之间的关联,获取数据挖掘的结果。
2.2输变电系统设备状态监测
输变电系统状态监测是在故障尚未发生时对电厂或电力设备的状态数据进行分析判断,通常包括数据采集分析、特征提取以及状态评估几个阶段,对于不同的电力设备需要采用不同的方法来获得初始数据。以变压器的状态监测为例,采集的信号包括振动信号、变压器油中气体、油中温湿度、电流电压等信号;可采用的方法有局部放电检测、绝缘恢复电压法、低压脉冲法等。
目前输电系统的设备状态检测主要集中对象有:变压器、断路器、发电厂和输电线路等。其中,发电厂的控制和数据采集系统可以收集体量庞大的数据,采用人工智能、专家系统和事件推理等方法与数据挖掘相结合,可以更加高效地处理数据。此外,输变电设备状态监测系统可实现线路在线监测数据、环境数据和地理信息数据等多路数据源的整合。