ii研究与探讨ii
基于灰模型端口短信预测垃圾短信治理研究*
*基金项目:国家社科基金重点项目(15ZDB154)收稿日期:2020-05-20杨光永1,王雷2,曾剑秋1
(1.北京邮电大学经济管理学院,北京100876;
2.桂林电子科技大学商学院,广西桂林541004)
【摘要】根据对近年来手机短信和垃圾短信有关数据进行分析,显示端口短信越来越活跃,通过对端口信息和垃圾短信最主要的构成部分商业广告短信息进行相关分析,得出两者具有明显的正相关性。以官方公布的2014-2017年端口
短信数量为研究对象,通过构建灰模型预测我国未来几年内的端口短信将持续增长,商业广告类端口短信将成
为垃圾短信治理的重点领域,并提出了垃圾短信预测和治理建议。
【关键词】垃圾短信;端口短信;相关分析;灰模型
doi:10.3969/j.issn.l006-1010.2021.03.022中图分类号:TN929.5
文献标志码:A文章编号:1006-1010(2021)03-0108-05
引用格式:杨光永,王雷,曾剑秋.基于灰模型的端口短信预测和垃圾短信治理研究•移动通信,2021,45(3):108-112.
2= OSID:
Research on Port SMS Prediction and Spam SMS Governance Based on Grey Model
YANG Guangyong1,WANG Lei2,ZENG Jianqiu1
(1.School of E conomics&Management,Beying University of P osts and Telecommunications,Beying100876,China;
2.School of b usiness,Guilin University of E lectronic Science and Technology,Guilin541004,China)
[Abstract]According to the data analysis related to mobile phone short message(SMS)and spam SMS in recent years,it is shown that the port SMS is becoming increasingly active.Through the correlation analysis between the port SMS and the
commercial advertising ,the major component of spam SMS),it is concluded that they have obvious positive
correlation.Taking the officially announced number of port SMS in2014-2017as the research object,a gray model is
established to predict that the port SMS will continue to grow in the next few years in China and the commercial port
SMS will become the major area of spam SMS governance.Hence,some recommendations are proposed for spam SMS
prediction and governance.
[Keywords]spam SMS;port SMS;correlation analysis;gray model
o引言
端口短信是手机短信重要组成部分,在商业广告、通知提醒等场景应用广泛,近几年来,端口短信逐年上升并大大超过了点对点短信的数量。从12321垃圾短信举报平台公布的数据来看,端口类短信举
报也大大超过了点对点短信举报,而在垃圾短信举报中,商业广告类短信占大多数,为此,加强端口类短信和商业广告类短信之间的研究对垃圾短信息治理有重要意义。
当前国外内对于垃圾短信治理研究多集中在事中或事后阶段,主要是技术上的关键词过滤、信息分类和法律规范处罚等手段21,对事前的防范举措不多,缺乏前瞻性和预测性工作,垃圾短信治理策略不够完整,一定程度上影响了垃圾短信息治理的效果。通过借助合适的理论模型,利用掌握的历史短信息数据对之后一段时期的数据进行预测,把握短信息的发展趋势,明确垃圾短信息治理的方向和重点领域,具有较强的理论价值和现实意义。端口短信作为当前手机短信最主要组成部分,也是垃圾短信的重要源头,对其进行趋势发展预测研究就显得尤为重要。
灰模型(Grey Model)主要针对"小样本"、"贫信息”等不确定性问题展开研究,通过提取有价值的信息部分挖掘内在规律,预测发展趋势切,该模型是学者邓聚龙教授于1982年在国际上首先提出,经过几十年的发展,灰预测理论已经在工业、农业、社会、经济、能源、
108|
飜器
第45卷
总第493期
杨光永,王雷,曾剑秋:基于灰模型的端口短信预测和垃圾短信治理研究
交通、石油等众多领域得到应用,成功地解决了生产、生活和科学研究中的大量实际问题。短信息具有明显的“信息量”不多,具有典型的“小样本”、“贫信息”等不确定性问题特点,可以借用灰模型来进行分析预测未来走势。目前学术界运用灰模型进行垃圾短信息治理的相关理论研究较少,缺乏对垃圾短信息治理的前瞻性和预测性研究。根据近年来的端口短信息和垃圾短信息举报的有关数据,结合端口短信息同垃圾短信息的相关性分析,基于灰模型对端口短信息未来发展趋势进行剖析和预测,进而能更好地明确垃圾短信息的治理的重点和方向31。
1短信息和垃圾短信数据分析
1.1短信息变化和发展情况
根据工业和信息化部公布的2014-2017年点对点和端口短信业务量,近几年来的移动短信业务量种点对点短信业务量降低,端口短信量提升迅速,见表1:
表12014年至2017年移动短信情况表
年份移动短信总数/亿条点对点短信幷乙条端口短信/亿条2014年7630.53522.54108
2015年6991.82722.94268.9
2016年66712178.34492.7
2017年66441332.25311.8
近年来点对点短信业务量的逐渐萎缩,跟、微博等OTT(Over The Top)平台短信息的替代作用分不开。、微博的社交属性更强,信息互动功能更多,用户体验更好,更为流行时髦,之前熟人、朋友之间大量的短信聊天、短信拜年等从手机短信逐渐转移到更为方便的、微博平台上来;其次是通信成本的原因,由于手机短信按次或套餐进行收费,而OTT短信息是基于网络流量化,每条短信通信成本可忽略不计;同时近年来,由于手机实名制的全面落实,对通过点对点发送垃圾短信形成了有效惩戒,一定程度上降低了点对点短信发送量。
由于手机短信的到达率高,推广性好(只需要知道手机号码就可以),在点对点短信发送量呈不断下降趋势时,端口短信发送量上升态势却十分明显。一方面由于近年来各类App、网站等都需要服务登录和身份认证,产生了大量的短信;另一方面端口短信在商业营销上有独特的优势,不像微
信、微博的信息发送和阅读基本局限于熟人朋友圈,企业只要得到用户的手机号码就可以发送营销广告类短信,而且端口短信资费也非常便宜,是很多大中型商家推广业务或推销产品的理想选择。
1.2垃圾短信举报情况
从工业和信息化部和12321举报中心有关工作报告数据看出,在受理举报的垃圾短息中,端口举报数和商业广告类垃圾短信呈上升趋势,尤其是2017年以来趋势明显。这主要是受手机实名制的影响和对违法违规短信的打击力度加强,当前对垃圾短信治理重点在端口号和商业广告短信息(见表2),根据12321网络不良与垃圾信息举报中心相关报告,近年来垃圾短信息内容所属类型
表2近年垃圾短信举报情况统计表
时间受理总举报数点对点举报数(占比)端口举报数(占比)商业广告类举报数(占比)违规违法类举报数(占比)2014年1季度274142216980.8%408114.9%997836.4%1743663.6% 2014年2季度347313111089.6%362110.4%1104431.8%2367868.2% 2014年3季度315682803888.8%353011.2%855527.1%2301372.9% 2014年4季度395943183080.4%776419.6%1480837.4%2478662.6% 2015年1季度210301584275.3%518824.7%658231.3%144486&7% 2015年2季度346912275665.6%1193534.4%1415440.8%2053759.2% 2015年3季度462173576977.4%1044822.6
%1358829.4%3262970.6% 2015年4季度430282986369.4%1316530.6%1355431.5%294746&5% 2016年1季度314112037664.9%1103535.1%1086834.6%2054365.4% 2016年2季度380071846548.6%1204431.7%1402336.9%2398263.1% 2016年3季度298181614754.2%86312&9%1171839.3%1810060.7% 2016年4季度263801451655%1090141.3%1160744%1477356% 2017年1季度22060842038.2%652229.6%911141.3%1294958.7% 2017年2季度38470769420%2382461.9%2946876.6%900223.4% 2017年3季度36796627517.1%2291362.3%2925379.5%754320.5% 2017年4季度431601149726.6%2192250.8%3262975.6%1053124.4% 2018年1季度509401352326.5%2510649.3%4829174.8%264925.2% 2018年2季度899661539317.1%5135157.1%7872087.5%1124612.5% 2018年3季度1156922706523.4%4286037.0%9509982.2%2059317.8% 2018年4季度1236784287134.7%6403151.8%7890763.8%4477136.2%
注:数据来源:《工业和信息化部关于电信服务质量的通告》和《12321举报中心工作情况月报》
2021年5月第3期
109
第45雅
总第493期h研究与探讨i!
主要分布在金融保险业推销、零售业推销、电信业务宣传、教育培训、房地产推销和餐饮业推销等,这些是垃圾端口治理的重要行业和领域。
图1是近年来端口垃圾短信举报数和商业广告类短信举报数的散点图,总体而言,端口类垃圾短信举报数和商业广告类垃圾短信都呈上升趋势。根据当前短信营销特点和实际情况,商业广告类短信主要由商业营销类端口发送,可以初步判断,端口垃圾短信和商业广告类垃圾短信两者具有很强的正相关性。
35000-
30000-2端口短信息灰模型分析
2.1模型建立
灰模型是基于人们对系统演化不确定性蒔征的认识,运用序列算子对原始数据进行生成、处理,挖掘系统演化规律,建立灰模型,对系统未来状态做出科学的定量预测。基于灰模型理论的预测法
主要包插数列预测、灾变预测、系统预测、拓扑预测等,本文选用的灰模型预测法为数列预测,即通过一定的时间序列和相应的数据来预测事物的发展趋势,模型分析过程一般为序列生成、搭建灰微分模型、构建数据矩阵、模型求解和检验等步骤W
(1)序列生成。假设*(。)(1)、x®(2)、…、x(6(M)作
侖20000-
数15000-
10000-
5000-
500010000150002000025000
端口垃圾短信举报数为预测对象的原始信息或数据,对它们进行一次生成处理,常用累加生成算子方法,即=
(2)建立灰微分方程,构造数据右阵。用微分方
程来表述新数列的变化趋势:务+宓(°=/>,其中,a
哈妮克孜演员
和方为辨识参数。辨识参数通过最小二乘法拟合得到:[;卜(丹尸巾.
公司免费起名网
其中丫为列向量:丫=(x®(2),x®(3),…,B为构
图I端口垃圾短信举报数和商业广告类短信举报数的散点图
利用SPSS.22软件做端口垃圾短信举报数和商业广告类短信举报数的双变量相关分析,结果如表3、表4所示:造数据矩阵:
'一护⑴+山⑵]B=■[曲⑵+少(3)]
表3端口垃圾短信举报和商业广告类短信举报描述统计举磁平均值标准偏差N
端口垃圾短信举报数11095.256635.88916
商业广告类短信举报数15058.757984.56116
表4端口垃彌信举报和商业广告类短信举报相关性分析
举砸相彌端口短信举报数商业短静报数
端口垃圾短信
Pearsonffi关性10.931®显葩(双尾)
16
0.000
N16
商业广告拓信和数
Pearsonffi关性0.931®1显葩(换)0.000
16 N16
注:在置借度(双测)为0.01时,相关性是显著的
可以看出,Pearson相关系数是0.931,在0.01的显著性明显,可以推断端口垃圾短信举报数和商业广告类短信举报数之间确实存在明显的正相关。
2
1
(3)GM(1,1)的求解:/1>(/+l)=[x<°>⑴--^+-,
平面镜成像特点a a
还原值为,)(f+l)=曲(州1)一0("=(1_眄妙(1)-即严;
(4)模型检验和预测:采取相对误差检验法,并预测下几个数据。
2.2模型应用
为检验灰模型预测效果,采用2014-2017年手机端口短信数据,分别为4108,4268.9,4492.7,5311.8,目前对2018年、2019年的端口短信量没有官方公布,但可以通过模型可以进行预测。
(1)序列生成:
对*0)作一次累加生成*"=(4108,8376.9,12869.6, 18181.4);
对*柞紧邻均值生成曲=(6242.45,10623.25,15525.5)。
1
⑹烝瓣
第45卷
总第493期
杨光永,王雷,曾剑秋:基于灰模型的端口短信预测和垃圾短信治理研究
'-6242.45f
(2)计算系数a和b:由前得知,B=-10623.251
'426&9' 4492.7
I-15525.51丿,通过计算得a=-0.113426,b=3466.465520o
(5311.8
(3)确定模型和GM(1,1)的求解:
灰微分方程的白化方程是:—-0.113426x(1)=3466.5;
dz
时间响应式整理得:x(1)(?+l)=34669.5e0113426(-30561.5o
求X(D的模拟值旳和其还原值Z:
x(D(l)=4108,x<»(2)=8272.1,x(1)(3)=12936.4, x(D(4)=18160.9;
因此:X<»=(4108,8272.1,12936.4,18160.9), X(°)=(4108,4164.1,4664.3,5224.5)O
(4)检验误差:
灰模型相对误差表如表5所示:
表5灰模型相对误差表
序号实际数据模拟数据残差相对误差
14268.94164.1104.8  2.45%
24492.74664.3-171.6  3.82%
35311.85224.587.3  1.64%
计算得平均相对误差为2.64%o对模型精度检验时,最常用的是相对误差检验指标,当相对误差aWO.Ol时,表示模型等级为好;当O.O10WO.O5时,表示模型精度为合格;当0.05WaW0.1时,表示模型精度勉强合格;当O.lWa时,表示模型不合格。从表5的相对误差值和平均相对误差值来看,该模型的精度等级为合格,可以进行下一步预测。
(5)预测:卅)(5戶5852,剧(6)=6554.9,泊》(7戸7342.2x。
通过测算,接下来三年端口短信的数量分别为5852亿条、6554.9亿条和7342.2亿条,通过预测,端口短信的数量上升势头明显,同当前市场的发展态势相吻合。2.3结果分析
由预测数据可以看出,端口短信的数量提升势头明显,逐渐成为移动短信市场中的最重要组成部分,点对点的信息量将日益萎缩,预测平均相对误差较低,预测效果良好。通过对端口短信的预测和同垃圾短信的相关性分析,能够使我们把垃圾短信治理的重点和方向转移到商业类端口短信上。
3端口短信和垃圾短信治理
当前的端口短信发送内容主要为通知类(含公益类)、触发类(比如验证码)和商业营销类,垃圾短信绝大部分是从商业营销类端口发送的,短信内容经常为“发票、办证、保险、诚招、抽奖、代+办、代办、折扣、优惠”等关键词。对端口垃圾短信的治理首先要把严格区分不同种类的端口,明确通知类短信端
口、触发类短信端口和营销类短信端口各种的功能和定位,同时把监管的重点转移到营销类短信端口上来,可从以下几个步骤来判断该营销类短信端口是否为垃圾短信端口,进而采取警告通报、整改、关停等手段,达到垃圾短信精准治理的效果。
步骤1:对商业类短信端口进行汇总。
步骤2:建立垃圾短信过滤模版(内容关键字),模版可根据实际情况不断完善更新。
步骤3:根据历史投诉总量(比如近三个月有无被投诉过的历史)、12321平台投诉、超业务范围内容关键字筛选,将其确定为疑似垃圾短信端口,没有此类现象的可暂时判定为正常短信端口。
步骤4:根据疑似垃圾短信端口,针对入网时间短、信誉度较差的公司定性为垃圾短信端口,采取一定的惩戒措施。
步骤5:对内容关键字筛选的垃圾短信结果,可适当进行复核,根据实际情况排除一些关键字筛选结果中的垃圾端口。
4结论与启示
对垃圾短信的预测和有针对性的治理是提高治理效果的重要保证,通过基于灰模型分析,端口短信
息数量将继续呈现升高态势,端口垃圾短信举报也将逐渐增加,端口短信已成为手机垃圾短信治理的主阵地。通信管理部门要对垃圾短信息治理工作重点转移到端口短信中来,在对端口好的具体管理工作中,要对通知类、触发类、营销类等各类端口号码做好分类分级,尤其重点做好营销类端口的监测,持续进行健康度、信用度分析。充分运用大数据技术,对违法短信严防死守,对商业广告等灰性质的短信要做好引导和区分,不断降低垃圾短信息对信息用户的骚扰。对出现问题的端口号码要根据不同程度影响或危害及时警告、惩罚、封闭相应的端口号冋,同时要牢牢坚持手机实名制,不断压缩对点对点垃圾短信的生存空间。
随着互联网、5G和人工智能技术的快速发展,短信行业应用场景将快速普及,端口短信量持续增长,企业
翳貂|111
第45卷
总第493期ii研究与探讨ii
柯蓝 李泉对移动信息服务的需求范围越来越广,端口类短信市场发
展空间将更加广阔,短信息中端口短信息比例持续上升。通信管理和运行部门在加大对端口号的监管
的同时加强对商业广告信息发送的规范和引导,更好地满足信息消费需求,保障信息消费者的权益。垃圾短信息是一个动态的发展过程,对垃圾短信息的监测也是一个动态的应对过程。通过对垃圾短信息数据科学分析,做好预测和事前管理工作,出其中的规律,防患于未然,从而更有针对性更有效地治理好垃圾短信息。
参考文献:
[1]黄锤,李伟渊,江鹏.我国垃圾短信的现状分析及其治理
对策研究[J].网络空间安全,2016(8):7-10.
[2]Ala Eshmawi.The Roving Proxy for SMS Spam and Phishing
Detection[D].Dallas:Southern Methodist University Doctoral dissertation,2015.
[3]崔立志.灰预测技术及其应用研究[D],南京:南京航空
航天大学,2010.
[4]肖利哲,黄姗.基于灰理论的均衡决策模型构建[J].统
计与决策,2014(13):22-24.
[5]程毛林,韩云.差分方程型离散灰模型与应用[J].统计
与信息论坛,2017,32(11):28-33.
[6]孙幸荣,张春.基于GM(1,1)模型的我国人口发展趋势分
析[J].统计与决策,2016(23):104-106.
[7]王正新,党耀国,裴玲玲.灰GM(1,1)無模型初始条件
的组合优化[J].统计与信息论坛,2012,27(6):55-59. [8]伟良,李亚平.有限实名网络环境中的个人信息保护[J].
华东经济管理,2016(5):174-17&★
!I疗軫亚■诸
I IZ I2021年5月第3期(上接第101页)是什么意思
续拉低了中国移动的市场份额,使其不得不采用同质化竞争来应对;在宽带业务市场上,传统老牌强者中国电信和中国联通受到了新晋强者中国移动差异化竞争的强烈冲击,“免费送宽带”策略大幅削减了两家的市场份额,中国移动趁势站上宽带行业市场第一的位置,市场格局发生历史性扭转。未来,三大通信运营商将会全面携号转网、5G、物联网、智慧家庭、云业务等关键领域展开激烈竞争,中国移动强者战略和中国电信、中国联通弱者战略的交锋仍会持续,新一轮的兰彻斯特法则竞争战略博弈即将开启。
参考文献:
[1]王于峰,杨小曼,王哲.移动互联网时代电信运营商的
转型策略和方案分析[J].移动通信,2014,38(20):86-91.
[2]逢海鹏.电信运营商竞争情报工作探究[J].移动通信,
2013,37(19):67-70+75.
[3]曹海航,田森平,张友强.结合兰彻斯特方程分析心理因
素对战争的影响[J].火力与指挥控制,2018,43(3):58-62.
[4]符亚男,陈丽华.4G时代中国移动SWOT分析及战
略选择[J].中国管理科学,2O15,23(S1):679-685. [5]周颖.电信运营商产品结构分析及优化建议[J].广东
通信技术,2018,38(12):66-69.
[6]张永辉,胡万里.基于波特五力模型的4G时代电信
业经营策略分析[J].电信科学,2014,30(4):129-134. [7]高雅娟.中国通讯企业在寡头竞争下的行为分析[J].
当代经济,2018(16):62-63.
[8]扬帆.商战中的兰彻斯特法则[J].经营管理者,
2002(11):60-61.
[9]矢野新一.兰彻斯特战略:弱者VS强者的战略[M],
2版.厦门:厦门大学出版社,2003:1-34.
[10]曹海航.兰彻斯特方程在现代战争中的应用[D].广东:
华南理工大学,2017.★
作者简介
李育晖(/0000-0002-2830-7827):工程
师,硕士毕业于桂林电子科技大学,现任职于广
西通信规划设计咨询有限公司,从事战略规划咨
询、市场研究分析工作,主要研究方向为地区数
字化发展规划、通信行业发展趋势、企业战略规
杨幂和李易峰实锤划、企业经营管理等