邮电设计技术/2021/02
——————————
收稿日期:2020-12-25
1概述
随着5G 和物联网的引入[1],移动网络越来越复杂多变,但人们对无线网络的质量要求越来越高,这对运营商的无线网络优化提出了新的挑战[2]。KPI 指标直接反映了无线网络的性能和质量,传统的小区KPI 突变检测方法是先采集PM 和配置等数据,网络优化工程师再根据专业知识和经验,对各个KPI 指标分别设置阈值,观察KPI 指标是否连续若干个小时超出阈值,来判断KPI 指标是否存在异常[3]。但是网络制式多样化,用户行为不可控,总会有部分属于正常性突变或者偶发性波动的KPI 指标作为异常被识别出来,这种方法存在资源投入大、阈值不准确、优化不及时等问题。
2传统无线网络KPI 突变小区检测方法
小区KPI 突变检测是无线网络优化的一个底层核心技术,是改善网络覆盖质量的重要手段,因此小区KPI 突变检测在无线网络优化工作中具有重要的指导
意义[4]。传统的小区KPI 突变检测流程如图1所示。
基于Prophet 时序算法的无线网络突变小区识别方法研究
Research on Recognition Method of Abrupt Cells in Wireless
Network Based on Prophet Sequence Algorithm
关键词:
Prophet;时序算法;KPI;突变小区
doi :10.12045/j.issn.1007-3043.2021.02.005文章编号:1007-3043(2021)02-025-06
中图分类号:TN929.5文献标识码:A
开放科学(资源服务)标识码(OSID ):
摘要:KPI 作为衡量无线网络质量的重要指标,准确及时检测KPI 指标突变情况非常重要。提出了一种基于Prophet 时序算法的无线网络突变小区识别方法,利用模型的预测指标得到动态门限,并在动态门限和绝对门限之间设置相对门限,通过实际指标与不同门限的对比,使运维人员更精准地掌握网络性能,降低误报和错报异常,提升网络优化效率和质量。
Abstract :
KPI is an important index to measure wireless mobile network.It is especially important to detect the mutation of KPI accu-rately and timely.It proposes a method of identifying abrupt cell in wireless network based on Prophet timing algorithm.The dynamic threshold is obtained by using the prediction index of the model,and the relative threshold is set between the dy-namic threshold and the absolute threshold.Through the comparison of actual indicators with different thresholds,the opera-tion and maintenance staff are able to accurately master the network performance and reduce false alarms and abnormal false alarms,which improves the efficiency and quality of network optimization.
Keywords :
Prophet;Timing algorithm;KPI;Abrupt cells
杨飞虎1,许国平2,刘贤松1,张硕伟1,郑敏之1,施亚洲3(1.中国联通网络AI 中心,上海200050;2.中国联合网络通信集团
有限公司,北京100033;3.上海联通无线网运营中心,上海200050)Yang Feihu 1,Xu Guoping 2,
Liu Xiansong 1,Zhang Shuowei 1,Zheng Minzhi 1,Shi Yazhou 3(1.China Unicom Network AI Center ,
Shanghai 200050,China ;2.China United Network Communications Group Co.,Ltd.,Beijing 100033,China ;3.China Unicom Shanghai Branch ,Shanghai 200050,China )
引用格式:杨飞虎,许国平,刘贤松,等.基于Prophet时序算法的无线网络突变小区识别方法研究[J ].邮电设计技术,2021(2):25-30.
25
传统的小区KPI突变检测是对全网各项指标进行日常性监控,并对有问题的小区进行预处理和派单。在监控KPI指标时,除了满足质差小区定义及突变小区定义外,还需要同时满足监控时间条件,如不满足监控时间条件则继续监控指标。通常在各项指标日常监控中,监控时间段为:09:00—24:00(15h),并且质差或突变条件触发后要同时满足“6h及以上或连续
4h”,才能触发告警派单。如果人为设定规则过于苛刻,监控系统预处理与派单有严重的滞后性,网络运维人员不能及时处理网络质量或性能问题[5];如果规则过于宽松,可能出现因为非无线原因、正常潮汐、特殊事件等造成的正常性突变或者偶发性波动被当作KPI指标异常处理的情况。
随着整个移动网络系统中数据规模的指数式增加,传统的基于“人为设置单一规则”的自动化小区KPI突变检测显得力不从心[6]。现阶段的网络运维优化迫切需要一种能够从海量运行数据中依据人工智能方法自动地获取和更新更加可靠的规则,以实现对无线网络质量提供强有力的保障[7-8]。
3Prophet时序算法介绍
Prophet算法是2017年Facebook发布的开源时序预测框架,它主要研究时序数据特征和时序变化规律,并对未来走势进行预测[9-10]。该算法不仅能够弥补传统时序模型对时序数据过于局限、缺失值需要填充、模型取法灵活性等不足,而且相较于传统的时序模型,在模型准确率以及使用者之间的互动方面具有更好的效果[11]。Prophet算法是一个可分解的时间序列模型,它对时序数据各个特征进行分析,例如对时序数据的长期趋势性、季节周期性、节假日效应等特征分析。Prophet算法通过将这几项特征拟合,累加起来得到时间序列的预测值。Prophet模型的构成如下:
y(t)=g(t)+s(t)+h(t)+εt(1)式中:
g(t)——趋势项,用来拟合时间序列的趋势性变化
s(t)——周期性变化,一般来说是以周或者年为单位
h(t)——节假日因素造成的影响,数据中是否存在节假日
εt——误差项,通常表示突发事件的影响
3.1趋势项
在Prophet算法中,趋势增长类似于种族增长。Facebook采用了2种增长函数,一个是基于逻辑回归函数,另一个是基于分段线性函数。
基于分段线性函数的趋势:
g(t)=(k+a(t)δ)×t+(m+a(t)Tγ)(2)式中:
k——增长率
δ——增长率的变化量(适应率)
m——偏移量参数
γ——让函数连续
基于逻辑回归函数的非线性趋势:
g(t)=
C(t)
1+exp{}
-[]
k+a(t)tδ×[]
t-(m+a(t)Tγ)
(3)其中,C(t),k(t),m(t)是随着时间t变化的函数,a(t)=(a1(t),...,a S(t))T,δ=(δ1,...,δS)T,γ=(γ1,...,γS)T。
3.2季节周期项
时间序列通常随着天、周、月、年等周期性的变化而呈现周期性的变化,在数学分析中,区间内的周期性函数是可以通过正弦和余弦函数来表示。在Proph⁃et算法中,使用傅里叶级数来模拟时间序列的周期性。傅里叶级数的形式如下:
图1传统的小区KPI突变检测流程图
26
2021/02/DTPT
邮电设计技术/2021/02
s (t )=∑n =1N
é
ë
êùûú
a n cos(2πnt P )+
b n sin(2πnt P )(4)
式中:
P ——时间序列的周期,如P =365.25表示以年为周期,P =7表示以周为周期
Prophet 的周期函数如下:s (t )=X (t )β
(5)
其中,
X (t )=ìíîcos éë
êùûú2π(1)t P ,sin éëêù
ûú2π(1)t P ...,
ü
ý
þ
cos éëêùûú2π(N )t P sin éëêùûú2π(N )t P 参数向量β初始化为β~Normal (0,σ2
)。
4基于Prophet 时序算法的突变小区检测方法
通过Prophet 训练模型的时序分解方法,将KPI 指标分解为3项:趋势项、周期项和误差项,针对趋势、周期特征分量,建立Prophet 模型进行预测。流程如图2所示。
a )将实际KPI 指标值与各分量的预测值相减获
得随机序列,随机序列的标准差和各分量的预测值合成得到KPI 指标的动态门限。b )在绝对门限和动态门限之间设置相对门限,来设定异常KPI 指标等级。
c )通过判断KPI 数值是否超过相对门限,来判定该KPI 指标是不是发生异常。4.1Prophet 预测
Prophet 算法在预测过程中,能够通过调整转折点
平台参数自动探测到转折点。对历史KPI 指标发生异常的数据进行调整,减少对KPI 指标历史规律的
影响,这样可以使预测结果更加灵活、平滑。
a )首先采用Prophet 模型训练的时序数据分解方法,将历史KPI 指标数据S t 分解成趋势项trend t 、周期
项(daily t ,weekly t )和误差项ε。
b )将分解出的趋势trend t 和周期项
(daily t ,weekly t ),采用Prophet 模型预测获得第t +3天趋势预测值trend t +3和周期预测值
(daily t +3,weekly t +3)。
c )将上述趋势预测值tren
d t +3、周期预测值
(daily t +3,weekly t +3)和误差项ε集成得到第t +3天小区KPI 指标的预测值S t +3,
S t +3=trend t +3+daily t +3+weekly t +3+ε。
4.2动态门限
根据中心极限定理,如果一个事物受到多种因素的影响,不管每个因素本身是什么分布,它们叠加后结果的平均值呈现正态分布。因此实际值与预测值的差值即随机序列呈现正态分布。正态分布的标准反映了组内个体间的离散程度。如一个较大的标准差,表示大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。
a )将历史KPI 指标数据S t 与趋势预测值trend t 、周
期预测值(daily t ,weekly t )相减得到随机序列R t ,
R t 呈现正态分布,R t =S t -trend t -daily t -weekly t 。
b )随机序列R t 的标准差反映了实际KPI 指标与
KPI
计算随机序列R t 的标准差σ,
σ=c KPI 指标的预测值S t +3与随
机序列R t 的标准差σ进行集成得到第t +3天小区KPI 指标的动态门限d_thres t +3,
d_thres t +3=S t +3+σ。4.3相对门限和绝对门限
a )公司对各个KPI 指标的健康度阈值有明确的
要求,如4G 接通率不能低于90%,4G 掉话率不能高于5%等等。根据KPI 指标的健康度阈值,设置绝对门限
a_thres 。
b )落在动态门限和绝对门限之间的数据不一定
很差。通过设置相对门限r_thres ,来控制派单量以及KPI 指标异常程度。相对门限设置10个等级,等级越
大,相对门限越大,落在相对门限和绝对门限之间的
图2基于Prophet 时序算法的小区KPI 突变检测流程
27
概率越小,KPI指标越接近于绝对门限,KPI指标异常越严重;等级越小,相对门限越小,落在相对门限和绝对门限之间的概率越大,派单量也会越多。设相对门限等级为β。
r_thres下=d_thres t+3+βd_thres t+3-a_thres
10
r_thres上=d_thres t+3+βa_thres-d_thres t+3
10
5实验分析
5.1原始数据
本文所采用的数据集来自某省网优某小区过去连续28天的KPI指标,数据集中包含日期、4G接通率等信息。在对原始数据分析的过程中,发现数据中存在格式的不一致性、空缺值和无用信息等噪声数据,这些噪声数据将会不利于模型的训练,需要对原始数据进行预处理。
5.2数据预测处理
数据格式。原始数据集中包含很多KPI指标,本文实验只是使用4G接通率,因此需要对其他KPI指标进行过滤。在保证原始数据完整性和准确性的同时,对原始数据格式进行转换,以满足算法模型对数据的
要求。
空缺值处理。原始数据中存在空缺值,如4G接通率在某一天的某个时刻没有数值。本文采用上下均值替代法,即用空缺值时刻的上个时刻数据和下个时刻数据的均值来填补缺失的KPI指标数据。经过一系列对原始数据的分析与处理,得到适合模型训练的标准、连续的数据集。
5.3参数说明
Prophet本质上是一种可分解的加法回归模型,即按时序特征可将时序数据分解为非周期性变化的趋势项、天或周的季节周期项和节假日效应等。因此,Prophet模型可以灵活地对各时序特征的参数进行设置,这些参数值的大小分别表示各个特征对模型预测结果的贡献度。通过分析模型的训练结果,可以调节各特征的参数,以便进一步提升预测精确度。本文使用的Prophet算法的部分参数说明如表1所示。
5.4实验结果
5.4.1Prophet算法预测结果与分析
如图3所示,黑点表示某小区4G接通率的真实数据,蓝线表示预测值。从预测结果可以看出,模型对历史数据有较好的拟合,自动调整历史4G接通率数据中的异常点,减小异常点对拟合曲线的影响,预测结果较好地拟合了大部分历史数据的规律,并对未来3天的数据进行预测,可以发现模型对KPI指标历史规律的预测比较准确。而且相较于传统小区KPI突变检测方法,能够对未来3天的KPI指标趋势进行预测。
5.4.2动态门限结果分析
如图4所示,浅蓝部分表示某小区4G接通率预测结果的动态门限。动态门限包含了大部分的真实值,在动态门限内的数值都属于正常KPI指标,而超过动态门限的数值则属于异常KPI指标。相较于传统小区KPI突变检测方法,动态门限更容易发现不符合历史规律的KPI数值,值得运维人员重点关注。
5.4.3相对门限与绝对门限结果分析
如图5所示,较深蓝部分表示某小区4G接通率预测结果的相对门限,深蓝部分表示预测结果的绝对门限。相对门限将动态门限和绝对门限之间的数据进一步筛选,选取1级相对门限,异常KPI数据减少了20%。因此,相对门限对异常KPI数据有进一步的筛选作用,帮助运维人员关注KPI数据异常程度更高
表1模型的参数
图34G接通率KPI指标预测值
参数名称
growth
changepoint_prior_scale
changepoint_range
weekly_prior_scale_
daily_prior_scale
changepoints
类型
Linear/lo⁃
gistic
double
double
double
double
double
说明
模型趋势的增长方式
模型的拟合程度
寻突变点的比例
表示模型的周季节性灵活度
表示模型的天季节性灵活度
指定潜在突变点
参考
数值
Linear
未识别的网络
0.001
0.95
auto
auto
None 2020-
05-09
2020-
05-13
2020-
05-29
2020-
05-17
2020-
05-21
2020-
05-25
2020-
06-01
2020-
06-05
预测值
历史值
1.00
0.95
0.90
0.85
0.80
0.75
4
G
日期
重点场景:复旦大学江湾校区,小区:杨淞殷-31,
4G接通率的原值和预测值
28
2021/02/DTPT
邮电设计技术/2021/02
的时刻。
5.4.4不同等级相对门限分析
如图6和图7所示,超过等级1相对门限的KPI 数值有8个,而超过等级3相对门限的KPI 数值只有5个。因此,不同等级的相对门限,可以人为控制KPI 指
标异常数量,减少预警次数。
如表2所示,某小区4G 接通率从2020年6月3日
9点开始发生异常,从11点到14点连续低于相对门限但未低于绝对门限,直到17点4G 接通率突然恶化,直接低于绝对门限,降到74%。可以发现模型对KPI 指标突然恶化有明显的预警作用,如果运维人员能够在2020年6月3日9点到14点到4G 接通率KPI 指标异常原因,那么17点就不会发生4G 接通率突然恶化,也不会造成用户投诉。
5.5应用效果
目前该方法已经在某省联通无线网运营中心进行试点使用,根据“区域”模块可选择全网小区、重点场景、网格、区县分公司等指定区域,通过时间和相对门限等级选择,可以自动对比绝对门限筛选出不同KPI 的TOP 小区,便于后台指标监控人员实时掌握不
同区域的KPI 突变情况(见图8)。
图5相对门限与绝对门限
图6等级1相对门限
图7等级3相对门限
表2
2020年6月3日4G 接通率实际值与3个门限
图4
动态门限
时间8:00:009:00:00
10:00:0011:00:0012:00:0013:00:0014:00:0015:00:0016:00:0017:00:0018:00:00
实际值/%100
94.0796.1992.8994.8894.7695.2495.76
95.52
73.79(低于绝对门限)88.69(低于绝对门限)
动态门限/%96.7596.4696.3596.4096.5096.5296.4196.2496.1196.1196.25
相对门
限/%96.0795.8295.7195.7695.8595.8795.7795.6195.5095.5095.63
绝对门限/%9090909090909090909090
预测值历史值
1.000.950.900.850.800.75
4G 接通率
动态门限绝对门限相对门限重点场景:复旦大学江湾校区小区:杨淞殷-31,4G 接通率的原值和预测值06-020:00时间
06-0206:0006-0212:0006-0218:0006-030:0006-0306:0006-0312:0006-0318:0006-040:002020-05
-092020-05-132020-05-292020-05-172020-05-212
020-0
5-25
2020-06-012020
-06-05预测值历史值
1.000.950.900.850.800.75
4G 接通率
日期
重点场景:复旦大学江湾校区,小区:杨淞殷-31,
4G 接通率的原值和预测值
动态门限2020-05-092020-05-132020-05-292020-05-172020-05-212020-05-252020-06-0120
20-06-05
预测值历史值
1.000.950.900.850.800.75
4G 接通率
日期
重点场景:复旦大学江湾校区
小区:杨淞殷-31,4G 接通率的原值和预测值
动态门限绝对门限相对门限06-020:00预测值
历史值
1.000.950.900.850.800.75
4G 接通率
时间
动态门限绝对门限相对门限06-0206:0006-0212:00重点场景:复旦大学江湾校区小区:杨淞殷-31,4G 接通率的
原值和预测值
06-0218:0006-030:0006-0306:000
6-0312:0006-0318:0006-040:0029