应用技术
0 前言
奥林匹克运动会起源于两千多年的古希腊,在奥运会上,各国互相交流体育文化、良性竞争,彰显了本国的体育水平和国家实力,也促进了各国人民的友谊。因此,国家奥运成绩是衡量国家体育水平的重要指标,也是受国内外学者重视的预测对象。
基于网络获取的相关数据,本文使用多元回归模型、决策树模型、聚类模型等经典数据挖掘算法,结合东道主效应、历史奖牌数量等信息,分类预测各国成绩,以求达到更好的预测效果。
京东购物流程1 数据介绍
■1.1 数据概述
数据挖掘技术依赖于强大的数据支持,奥运会的成绩不仅和历史成绩相关,还与其他各种因素相关,本文通过世界权威组织 (国际奥委会、联合国、世界银行、中国国家统计局等) 的以及谷歌地图、等获取了大量的原始数据。本文首先对不同来源的、甚至语言不同的数据进行了统一、清洗和整理。之后,通过“映射”函数(VLOOKUP),建立了EXCEL数据表格。
本文选取的变量主要有:上一届获得金,银,铜,奖牌数X1,X2,X3,X4,国内生产总值X21,国内生产总值增长率X22,中学入学率X23,通电覆盖率X24,铁路公里数X25,人口总数X26,14岁以下人口比例X27,参赛人数X31,参赛次数X32,举办次数X33,首都距离X34。■1.2 数据预处理
考虑到一个多世纪以来,世界格局的巨大变化对奥运成绩的影响,我们对历届奥运会与2016年里约奥运会的奖牌数量关联程度做了分析。首先,以2016年参赛国家数为标准,缺席的国家一律填入0。之后,分别计算各届奖牌数量与2016年奖牌数量的相关系数。根据相关性结果,本文只选取相关系数在0.97以上的数据,即1996年奥运会及之后的历届奥运会的历史成绩作为主要的数据集。2 对奥运会成绩历史因素的分析与预测■2.1 模型假设社保卡里面的钱可以取出来吗
a.首先假设各国成绩存在稳定性,即各国成绩不会发生毫无预兆的突变。
b.其次假设各国成绩存在传承性,即可以通过各国前几年的成绩预测后一年成绩。
c.再次假设各国成绩存在随机性,即可以忽视运动员临场发挥带来的影响,奥运会成绩可以体现该国体育水平。
d.最后假设体育水平相似国家之间奥运成绩具有相似性,即这些国家在金牌榜上的区域的大致位置短期内不会出现巨大改变。
免加盟费汉堡连锁店■2.2 对国家进行分类
随着奥运会的影响力的扩大,越来越多的国家参与到了其中。但是,通过对历史成绩的分析,我们发现不同国家的奥运成绩相差很大。
在1996年之后,以美国、中国、俄罗斯为代表的体育强国几乎包揽了近20年奖牌榜的前3名,以德国、日本为代表的发达国家虽然不如中、美、俄等超级大国,但是同样有着优秀的成绩,而有些国家的历年总奖牌非常少,有的甚至没有任何奖牌可言。显然,各个国家对奥运会的重视程度非常不同,因此在预测各国奥运会成绩时,我们有必要对国家先进行分类,再分别进行回归分析。综合金牌数量和奖牌总数量,我们通过条件函数(IF)将样本分成如下四类:
a.第零类 前一届奖牌总数在4枚以下的
b.第一类 前一届奖牌总数在20枚以下,且在4枚及以上的
c.第二类 前一届金牌数在10枚以下,奖牌总数在20枚及以上的
d.第三类 前一届金牌数在10枚及以上的
同时,奥运会各年的金牌总数不同,这会为预测会带来较大的误差。观察我们选取的从1996年到2016
年的金牌总数,除1996年以外,其它几届奥运会的金牌数量约为300枚。因此,我们将1996年的奖牌总数从271枚扩大为
多元线性回归模型预测2020年奥运会成绩
杨钦崴
(徐州市第一中学,江苏徐州,221000)
摘要:奥林匹克运动会是世界上最受瞩目的体育赛事,旨在通过体育技能的切磋,鼓励人们积极进行体育运动,并促进人们互相了解、友好交流,是属于全世界人们的盛会。历届奥运会期间,各国取得的奖牌数量无疑是人们谈论最多的话题之一。近年来,数据挖掘处理技术的极速发展为社会生产生活提供了极大的效益和便利。本文利用SPSS、EXCEL等软件,使用回归、决策树、聚类等经典机器学习算法,对历史成绩、综合国力、地区差异、人口数量等若干数据进行了统计和分析。
关键词:奥运金牌预测;分类拟合;地域差异;多元线性模型
www�ele169�com  |  121
122  |  电子制作    2018年2-3
月合刊
0.36。因此,通过以上变量来试图预测残差是不可行的。因
此可以对各个类别使用多元非线性回归模型。对于X21和
r 级 韩国 太美了黄奕老公黄毅清>比熊犬X26取对数,其他变量不变。
■2.4 多元非线性回归模型
通过EXCEL 线性回归函数,我们可以得到初步的预测模型。通过模型的R square 和P-value 值,我们可以进一步优化模型。如果模型某个参数的P-value 值不能通过0.05的显著性检测,那说明此参数对于回归模型的影响很小,我们应该去掉该参数,重新对数据进行线性拟合,如果新的模型的R square 的值变大,说明拟合效果变好,那么就保留
新的模型,反之则不保留。其中第三,二,一类国家预测效果较好,但第零类预测效果差强人意。最终预测模型为:
◎ 第三类Y3=517.83+X27*2.34+lg(X21)*25.91-X34*(7.7E-07)-1.60*X23-X24*7.04+X1*0.61+X3*0.97◎ 第二类Y 2=-85.54+l g (X 21)*7.23+X 34*(4.29E -07)+X1*1.68+X3*1.05
◎ 第一类
Y1=-18.19+lg(X26)*2.34+X23*0.16-X24*0.01+X1*0.61
奖牌总数(X4)”是模型分类的最主要因素,其次是“入学
率(X23)”、“GDP(X21)”、“人口总数(X26)”等。分析可知,14岁以下人口占比越高,且上一年奖牌也取得
优异成绩的国家,越容易在本届奥运会中摘得奖牌;14岁以下人口占比越低且GPD 总额少于2.8亿美元的国家,或者14岁以下人口占比越低、中学入学率低83.882%且与东道主国家距离差距很大的国家,越不容易摘得奖牌。此外,“GDP 增长率(X22)”和“人口总数(X26)”也对奥运成绩有一定的影响,这两
者的值越大,国家越容易获得4枚
以上的奖牌,反之,不容易取得好成绩。通过决策树,也证明了我们对于影响奖牌因素的假设是正确的。历史成绩、综合国力和地域差异均对各国奥运会的发挥产生着巨大的
影响。
图2    C5.0决策树分类结果
■2.6 模型小结
通过观察我们的线性回归模型和决策树模型,可以发
现,奥运总奖牌数量不仅和历史成绩、综合国力有着非常大
图1    聚类算法“两步”的详细结果
应用技术
的关联,而且与地域因素也关系密切。我们通过分析发现,历届东道主国家的名次,几乎都要比该国为非东道主好一些。地域差异从另一方面也说明了“东道主”效应,越是有地域优势,越能够发挥出自
己的水平、甚至是超常发挥。此外,我们还加入了各国历届奥运的参赛情况作为辅助,这些方面其实和历史成绩是相互关联的,参赛经验甚至是举办比赛的经验,都从侧面反映了一个国家的体育水平、对奥运会的重视程度。
3 对于2020年奥运会成绩的预测
我们对2020年奥运会奖牌前10名的奖牌数量和名次进行了预测,结果如表1所示。因为前十名国家成绩均属于第三类成绩,因此只需要利用模型3.0的非线性回归模型。表1  2020年奥运会各国总奖牌数和名次预测结果
名次国家预测结果名次国家预测结果1美国119�26636日本35�00854 2中国93�865647法国31�59123 3俄罗斯54�349688加拿大31�49211 4英国50�772259意大利30�24027 5德国41�1435410澳大利亚28�62637 4 结论与展望
我们利用互联网上丰富的资源,爬取了各国国家的奥运历史成绩,利用回归模型建模,预测未来的奥运成绩。通过对国家历史成绩对国家进行分类,并对不同种类的国家分别建立预测模型,可以提升回归预测的效果。除了历史成绩、参赛经验,国家综合实力、地域差异等也会影响奥运成绩。我们从经济实力、交通能力、教育实力、国民素质等多方面去衡量了综合国力,计算各国首都到东道主国家首都的距离衡量地域差异,并统计了各国的参赛次数、参赛人数、举办奥运会次数等等。综合考虑上述
所有因素,同样适用回归模型。通过对比,我们发现,这些因素的加入提升了模型预测的准确率。最终,我们根据该模型预测了2020年奥运会奖牌榜的前10名和他们的奖牌数量。
我们希望通过本文,能够对我国体育事业的发展贡献一份小小的力量,通过预测奥运成绩,分析各种相关影响因素,为奥运出谋划策。
参考文献
* [1]吴殿廷, 吴颖. 2008 北京奥运会中国金牌赶超美国的可能性——基于东道主效应的分析和预测[J]. 统计研究, 2008, 25(3): 60-64.* [2]王国凡, 唐学峰. 奥运会奖牌预测国内、外研究动态及发展趋势[J]. 中国体育科技, 2009, 45(6):3-7.
* [3]江立平. 用统计回归方法预测我国代表团在2008年奥运会上的奖牌数[J]. 南京体育学院学报(自然科学版), 2007, 6(2):53-55.* [4]王国凡, 薛二剑, 唐学峰. 大型国际综合性运动会奖牌数预测研究——以北京奥运会为例[J]. 天津体育学院学报, 2010, 25(1):86-90.
* [5]Bernard A B, Busse M R. Who wins the Olympic Games: Eco nomic resources and medal totals[J]. Review of Economics and Statistics, 2004, 86(1): 413-417.
* [6]Johnson D K N, Ali A. A tale of two seasons: participation and medal counts at the Summer and
Winter Olympic Games [J]. Social Science Quarterly, 2004, 85(4): 974-993.
避雷线的具体电阻大小有明确规定,只要严格依据规程操作,能避免很多隐患。
2.5.3 重合闸的安装
一般情况下,相关人员需要对输配电线路将重合闸进行安装,将线路抗雷击性能加以提升;目前在城市中,大部分输配电线路都会将重合闸安装上,并应用相关原理可以实现自动恢复的能力。优于输配电线路倘若遇到雷击的情况,那么就有可能出现跳闸的情况,相关人员将重合闸安装完成以后就可以将预防雷击的能力加以提升,确保在雷雨的天气也能够正常供电。重合闸的价格有些昂贵,在需求过大的时候可以安装此设备,是具有防雷效果较好的一种预防手段。为了进一步应对天气问题给线路带来的问题,在建设电杆塔时应考虑到雨天给地基带来的不良影响,电力部门企业针对天气变化应密切关注,将电杆塔地基的稳定性加强,提升电杆塔的抵抗能力,工作人员在对雨天发生的问题应采取合理的措施进行解决,防止雨水造成线路的损坏,引起事故。
3 结语
在对电力输配电线路的维护中,需要加强对线路的管理和检查,完善相关管理制度,提高维护工作的质量和效率,提升工作人员的重视和技术,将输配电线路的状态维持在最佳水平,保持线路能够稳定的进行供电,促进电力系统的整体发展,使人们的生活更加方便快捷。
参考文献
* [1]林令贤, 林鑫. 运行维护和故障排除技术在电力输配电线路的应用[J]. 工程技术:全文版, 2016(12):00254-00254.
* [2]曹东. 电力输配电线路中运行维护、故障排除技术的应用及重要性探究[J]. 科学中国人, 2016(1X).
* [3]邱平. 探讨电力输配电线路中运行维护和故障排除技术的应用[J]. 华东科技:学术版, 2017(11):305-305.
(上接第133页)
www�ele169�com  |  123