提取每个阈值点的
大小和出现频率
编译分类器
(结束)
图1流程图
)0 =/〇(L) =$1L0 +$!L  + …+ $乂5l  =/l  ( L) =«1L  1 +a2 %21 +•" +a n Xl
=/' ( L) W  $1 <, + W  + …n  $乂"
0引言
在电力缴费一体化建设中,需要利用智能电表所采集的大数
进行异常用电定位实现抄核收的一体化和智能化,并 准负载预测为电力营销的模式创新提供数 。因此有
用智能电表大数据进行随机负载建模[14]。传统基于测量的负
荷建模通
变电站级别的负载测量,但
能电表能够提
15分钟到一个小时的时间分辨率的单个用户负载数据,这使 发更准确的随机负载模型成为可能[4_5]。
用智能电表的大数据进行详细的大规模仿真需要极大的
计算成本。除了大数据问
,高度
用电模式也使
随机负载建模面临极大挑战[64。为此,本文提出一种新的负 载建模方法。该方法可简化数据的 ,同时保持数据分辨
率,并最大程度地
负载
的数量。最后通过试验对该
方法的有效性和优点进行验证。
1 模方法
所提出智能电表数据建模方法的主要步骤如图1所示。
1&数据预处
数据预
数据集中的缺失值或零值数据样本。数
F
由将近6 000 用的每隔半小时的'个用电序列记录
组成。单用户的用电量
5表示为%
5 = [y 〇(L ),y 1(L ),…,y '(L)]
(1)
式中:y m 为在时间点L 上的用电量。设/是5及其导数的向量
值函数,则5可以由(阶和'维的常微分方程组表示:
定稿日期& 2020 -03 -28
________________________________________________________
电力系统及其自动化____________《*
+_〉〉2021 /043101期
Power  System  &Automation
使用智能电表数据进行智能电网负载分析
王刚,杨志杰,徐新宇
(国网新疆电力有限公司电力科学研究院,新疆乌鲁木齐830017)
摘要:面向异常用电定位和电力营销模式创新的电力缴费系统的一体化建设对负载预测提出更高的要求。为此,提出了一种基于智
能电表数据的随机负荷建模方法。通对用电量模式进行
化和 ,将始智能电表数据简化为加权合并和 化
的用电量曲线,从而实现负载数据的聚类分析。试验结果证明了方法的鲁棒性和准确性。
关键词:负载建模;负载分析;粒
优化;智能电表;聚类算法
D O I :10.3969/j
. issn . 1000 -3886.2021.01.020
[中图分类号]T M 744 [文献标志码]A  [文章编号]1000 - 3886(2021)01 - 0067 - 04
Smart Grid Load Analysis Using Smart Electric Meter Data
Wang Gang, Yang Zhijie, Xu Xinyu
(State Grid
Xinjiang E lectric Power
Co. !
Ltd. Electric Power Research Institute! U rumqi Xinjiang 8
A b s tra c t  & The
integrated  construction
o f
the
e le c tric ity  paym ent  system  oriented  to  abnorm al  e le c tric ity  u tiliz a
e le c tric ity  m arl^eting  m odel  poses  a  high  re quirem ent  on  load  forecasting . To  this  e n d ,a  random  load  m odeling  m etliod  based  on  smart e le ctric  m eter  data  was  proposed . A cco rd in g  to  th is  m e th o d ,the  e le c tric ity  consum ption  mode  was  linea rized  and  clustered  so  that o rig in a l  smart  m eter  data  could  be  s im p lifie d  into  a  power  consum ption  curve  o
f  w eighted  m ergin
g  and  lin e a riz a tio n ,thus  re alizing cluste ring  analysis  o f  load
data .
E xperim enta l
results
proved
the
robustness  a nd
accuracy  o f
the
K e y w o rd s  & load  m o d e lin g ; load  an a lysis ; p a rtic le  swarm  o p tim iz a tio n ; smart  e le ctric  m e te r ; cluste ring  algo rithm
00^0
)/
2
/(V
h
M ~~
N
Electrical Automation
67
《*+_〉2〇21/043101期___________电力系统及其自动化
Power System &Automation 方程组(2)的范德蒙矩阵形式为%
式(3)简写为-/(L0) -
00L0"_$1_
f(L1)W
L_尤2_...n
'
L1$2(3) -f( X m)■
m' 2m
m Xm•••L m」L$n」
5[F][N][:](4)
式中为用户。因此,数据集s=[a i,a,…,a j(其中c为 用户')代表每个用户随时间变化的用电量数据,其中用电量和 时间的函数关系是连续的、非线性的。
1.2扩展k均值聚类算法
为了表征用 的用电模式,本文使用扩展k均值聚类算法对数据集进行处理&84]。对于具有'个数据实例的数据集S,生 成Y个聚类,即C i、C!、…、8,/8)代表聚类Y的聚类中心,则Y 均值聚类算法的误差函数公式为&
+ > !!=[l,/8)](5)
i=1L/C.
式中:〖为聚类数;=[l,,/8)]为数据点l与聚类中心;/8)之间的。
作为具有较好杂散能力的常用的邻近度量之一,用平方欧几里得距离来计算聚类成员与聚类中心之间的距离[11@2]。对于两个不同的数据点L和L,平方欧几里德距离可以表示为:
=(L,L)> !(L i - L)2 (6)
k=1
扩展k均值聚类算法使用Y均值将每个聚类(父聚类)以分 层的方式分为两 (),的每个节点均满足停 件。第一停止条件是聚类用户数量低于阈值。低于阈值的将被视为具有足够的聚类内模式相 。根 验 ,在智能电表数据的 和试验中,用户数量 总人口的百分之一的 部模式相似度足以用 式提取。虽然在 中拥有更少的用 以生成更紧凑的集,但是计算成本也将大幅提高。因此,必须保持聚类数量与特性相似度之间的平衡,以在实现 数据精简的 最大程度地降低对计算成本的影响。因此,根据验 将百分之一用户作为第一停 准。
重 的第二个停 件为 差低于父聚类误差。选择误差作为停止条件的关键障碍是数据的易变性。在 聚类结果的每 ,为父集和 计算平均绝对百分比误差。Y的误差计算方法为:
+Y> 士{$«![8i @C(8)X100]} (+ )式中:+为聚类Y相对于聚类中心/C y)平均值的误差;C y.为用 户〖所在的聚类Y;'为用户总数。在重 的 中,误差 小到最小,差会饱和。
EP*E C(8)式中:+为父集的误差;+为子集的误差。因此,如果重聚 不满足停 件 1,重 满足停 件2。扩展的k均值 的流程如图2所。
扩展k均值聚类
算 法 将 数
(父 )分为两
(),
用户 ,a d2,…
位于一个聚类中,而
其余用户a-,a%,
a$,…被分配给另一
。重
将每 分为
两部 分,1的
分支而产生的两个子
聚类:a1,a12,a15,,
和 a5,a13,a18,…。
其他聚类同样细分,
所有 满足停
件之一。公
式为:
图2扩展k均值算法
F C1 -"$1 "
F C12
w c m"]
$12
F C15$15
-4」
(9)
1.3曲线平滑和线性化
从 生成平均用电量曲线文件,以便使用单个函数表示聚类用户的用电量数据模式。平均用电量 有很大的波动,这些波动会使数 式不清楚。因此,可以应用多项式 :拟合和移动平均平滑等 平滑 平滑数据。较低次数的多项式 获较高的变化,而较高次数的多项式则遭受了朗格现象的影响,这给 平滑带 度。在大多数情况下,平用
电量 用电量 变化所导致的数 声。为此使用动平 平滑化 数 。动平 平滑 一
程,可以表示为[13]:
_ .!Ci.+1
(1〇)式中:5为变量;C为卷积整数;y为运行索引;?为时间段数。平 滑后,将用电量 化以降低数 式的复杂性。使用泰勒级数 化过程可以实现 函数的线性化。用电量阈值点被用作 化的工作点。
值点后,数据点将被忽略以进行线性化。在三个 数据点或一个半小 现的阈值点将被忽略,以进一步减小变化。阈值点仅用作泰勒级数 至第一阶的操作点。高阶项被忽略,因为 的影响可以忽略不计。尽管已经实现了线性化,但需用式(11)对丟失的数据点进行插值,以平滑用电量。
5(L+1 —L) +5(L—L)
5 = -(11)
L+1_L
式中:5为5i在时间点L+1处的插值,其中i=0,1,2,…,(。对于
68 Electrical Automation
'0 20 40 60
80 100 120 140 160 180
时间/h
(b )原始和加权线性化的曲线
图4试验1结果
个用户节点的用电量进行建模以发现异常用电,并进行精准电力营销,需要对大量数据进行 ,
致计算成本过
高。
提了一种通过使用一组加权线性曲线对高,性智
能电表数据进行随机建模的新方法。该方法采样优化 算法,
对模式相似度高的数据进行,以提取用电量分布图。与普通
逼近方法相比,该方法对
用电量数据进行线性化处
,而不会影响精度。试验 ,提取具有高度
式相似
性的模式、将高度非线性的函数转换为 函数的级联能够在不
低准
的基础上有效提高智能电表数据建模的效率。
参考文献:
& 1 ]何哲楠,吴浩,程祥,等.基于变电站-用户双层结构的变电站负
荷聚类研究[J ].电网技术,2019, 43(8): 2983 -2991.& 2] 旭,徐箭,廖思阳.基 能电能表的居民需求响应协同策略
[J ].电测与仪表,2019, 56(13): 136 -141;147.
[
3 ]
紫熠,刘卿,
,等.基
能电表运行故障数据的纵向分析
型[J ]< 计算机科学,2019, 46(増
1) % 436 -438$456.
[4 ]宋军英,何聪,李欣然,等.基于特征
及熵权法的日负荷
方法[J ].电力系统自动化,2019, 43(20): 65 -76.
[
5 ] 毅,张宁,康重庆,等.电力用户行为模型:基:念与研究框
架[J ].电工技术学报,2019, 34(10): 2056 -2068.
[
6]
葛 , 峰,刘洪,等.考虑
特征与行为因素的家庭用能
特性建模[J ].电力自动化设备,2019, 39(3): 36 -44.& 7 ]
婧,徐蓝,
,等.基于自适应k -meanS ++算法的电力负荷
特性分析[J ].南方电网技术,2019, 13(2): 13 -19.[
8]
吴迪, , ,等.基于大数据的
电模型与方法[J ].北
京化工大
报(自然科学版),2018, 45(6): 79 -86.
[9] , .基于k
均值小波张馨予
网络的二阶段空调负荷预测
& J ].
报(自然科学版),2018, 46(3): 416 -421.
[10]
颖,阮应, ,等.基于k -means  4
B P 神经网络算法
的办公建
电负荷预测[J ].热能动力工程,2018, 33 (3):
138 -144.
图3每周用电量采集的百分比误差
用电量 ,这会导致连续的 不连续的导数串联在一
化的
以由切线的串联来表示,
在工作点$
以形成
,如式(12)所
5= ![/($) +/_$)(L -$)]
(12)
i  = 0式中:/($)为$的导数。通过曲线的线性化减少了数据的复杂 性,并将如式(3)所示的复杂非线性函数简化为如式(12)的线性 函数。这种
化转换简化了用电量随
的变化。
2仿真试验
试验数据为近5 000名来自乌鲁木齐地区用户的一年的智
能电表数据。数据集由6个逗分隔值(CS *)文件组成,总大小 为3 G B 。使用M A T L A B 平台实现上述方法,并在8 G
B R A M
In te l  Core  i 7
笔记本电脑上进行两个仿真实验。
第一个试验以周为频率对预 的数据进行聚类。整年52
周的数据在每个单独的星期进行聚类,从而生成52
。时间分辨率为30 m
i n
的每周用电量分布图的维数为! = (60 X
168)/30,即336。提取每个最终 的平均用电量分
并进
化以生成加权 分
第二个试验的 的时间窗口从一周增加到一个月。
使用一年的智能电表数据每月进行一
。每
的用电量数据文件都有不同的维度,
取决于月份中的日期。
在每个试验中都有 单用户的聚类,
数据在统计
上被称为离值。由于这些数据仅占原始数据的0. 319以下,
试验首先剔
值。
用电模式在一的可变性较大,因此试验1中生成的
聚类数量也更多,并且 成员的一致 见。如 3所
,低误差表 化
已高精度地逼近了原始用电量 。图
4显了一个典型周的
况。可以
廓几乎拟合 轮廓,
用电量的变化最小。在试验2中,用电量细节变化的影响相对小于试验1,从而
导致
数量
。 期的延长显示了用电模式的季
节性变化。简单的 化用电量数 件可用于中期用电量预
测研究,特别 节性用电量的变化。图5显示了四个随机的月
及其用电量
3结
在智能电网中,智能电表产生大量的用电量数据,因此对每
电力系统及其自动化____________________《电+
_〉〉2021 /043101期
Power System &Automation
•r
u i o e r M
^/躺
%/_晖
纪农
Kn
Electrical Automation
69
m i l i i
时间/h
(d )春季原始和线性化曲线
100 200 300 400 500 600 700 800
时间/h
(e )夏季聚类结果(六月)
图5试验2结果
[11] 孙建军,张世泽,曾梦迪,等.考虑分时电价的主动配电网柔性负荷
多目标优化控制[J ].电工 报,2018, 33(2): 401 -412.
[12] 唐良瑞,王瑞,吴润泽,等.面向全景调控统一数据模型的缺失
数据填补算法[J ].电力系统自动化,2017, 41(1): 25 -30;87.[13] 鹏,赵磊, ,等.智能电表数据分析元及示例[J ].南方电
0♦00♦00♦00♦00♦00♦00♦00♦00♦00♦00♦00♦00♦00♦00♦00♦00♦00♦00♦00♦00♦00♦00♦00♦00
(上接第40页)
[7 ] , ,晴.基于双5控制器的模块化多电平变换器环
流抑制 [J ].电网技术,2014, 38(10): 2905 -2912.[8 ] ,丽,李国.基于M M C 的整流系统在不对称桥臂下
的环流抑制方法[J ].电气自动化,2017, 39(2): 12 -15.[9] 徐,袁旭峰, ,等.电网不同运行条件下M M C 环流抑制技
[J ].电力科 工程,2018, 34(12): 10 -17.
[10] 杨晓峰,李泽, 林.基 拟阻抗滑 制的M M C 环流抑制
网技术,2016, 10(1): 1 -5.【作者简介】王刚(1986—),男,新疆人,工程师,主要研究方向:电力营 销。杨志杰(1970—),男,新疆人,工程师,主要研究方向:电力营销。
徐新宇(1991—),男,新疆人,助理工程师,主要研究方向:电力营销。0
策略[J ].中国电机工程学报,2018, 38(23): 6893 -6904; 7123.[11]张馨予,张钢,钱江林,等.具有低次谐波抑制能力的P IR 控制器
设计[J ].电工 报,2016,31(増 2):19-27.【作者简介】张明光(1971—),男,甘肃人,教授,专业:电气工程,研究方
向为柔性直流输电系统。【通信作者】孙虎忠(1996#),男,甘肃人,硕士,专业为电力系统及其自动化,研究方向为柔性直流输电系统。
《*+_〉〉2021 /第431第1期_____________________电力系统及其自动化
Power System &Automation
o  5 o  5 C
•r .s U I 0e ).q A ^
l_l /躺轵.0.8.6.4.2.0.8.6.4.2011 11 11 11 11 c l 】 c l 】 c l 】 c l  3
〔T
u
i o e r A V ^/
躺轵〔
(l .u i o e r A ^l u /赫轵
70 Electrical
Automation