收稿日期:2008-10-13  修回日期:2008-12-22
作者简介:王朝信(1979-),男,山东莘县人,硕士,讲师,研究方向为足球教学与训练。作者单位:菏泽学院体育系,菏泽274015。
●运动训练学
K -Mean 聚类分析对第18届世界杯足球赛各参赛队进攻能力
研究
王朝信
摘 要:对第18届世界杯足球赛32支球队64场比赛的进球数、射进指数、助攻、射正球门次数、射门次数、角球、任意球、越位、反击次数、短传、长传、传中次数等12项进攻指标进行K -Mean 聚类分析,并对各指标的差异性进行方差分析,结果显示各类间在场均进球数、射进指数、助攻、射正球门次数、射门次数、角球、短传次数等7项进攻指标上均存在显著性差异,表明应用K -Mean 聚类分析对球队的各项进攻指标进行量化评价具有较高的可靠性,可以客观地反映出各队的进攻能力,揭示出现代足球进
攻的发展趋势,并探索一种较为合理有效的量化评价球队进攻能力的方法。关键词:第18届世界杯;足球赛;进攻能力;K -Mean 聚类分析
中图分类号:G843  文献标识码:A   文章编号:1008-1909(2009)01-0110-04
K -M ean Ga thers a K i n d of Ana lysis on the A tt ack Ab iliti es i n the 18th Sessi on of W orld Cup Soccer Gam e Each Parti c i pa ti n g Team
关于长江的诗WANG Chao -xin
(Physical Education Depart m ent of Heze Collage,Heze 274015,China )
Abstract:Enters the ball numbers t o the 18th sessi on ofWorld Cup s occer game 32tea m s 64competiti ons,shoots the index,the secondary attack,shoots the goal number of ti m es,shoots the number of ti m es,the corner kick,the free kick,the offside,the counter -attack number of ti m es,passes in short distance,in the l ong pass,the bi ography the number of ti m es and s o on 12attack targets carries on K -Mean t o gather a kind of analysis,and carries on the variance a 2nalysis t o vari ous targets difference,finally de monstrated during each kind enters the ball number in the field,shoots the index,the secondary attack,shoots the goal number of ti m es,shoots the numb
er of ti m es,the corner kick,passes in short distance the number of ti m es and s o on in 7attack targets t o have the difference,I ndicated gathers a kind of analysis using K -Mean t o carry on the quantificati on app raisal t o tea m’s each attack target t o have a higher reliability,may objectively reflect vari ous tea m s the attack ability,p r omulgates the modern s occer attack the devel opment tendency,and exp l ores one kind ofmore reas ona 2ble effective quantificati on app raisal team attack ability the method .
Key words:the 18th sessi on of World Cup;s occer games;attack ability;K -Mean gathers a kind of analysis
  由于现代足球全攻全守的整体性打法趋势使足球比赛的攻守矛盾日趋激化,给进球增加了更大的难度,导致近几届世界杯足球赛的进球率呈下降趋势,体现出球队越来越注重防守的发展方向,所以很有必要对球队的进攻体系进行系统地研究与分析。但目前国内、外关于足球进攻体系的研究大多数停留在各指标间两两比较的研究与分析上,缺少对足球比赛多因素综合分析,尚未从比赛活动的整体角度对球队的进攻能力的运用效果进行评价。为此,本文拟选择进球数、射进指数、助攻、射正球门次数、射门次数、角球、任意球、越位、反击次数、短传、长传、传中次数等12项主要进攻指标,应用K -Mean 聚类分析法对第18届世界杯足球赛各参赛队的进攻质量给予综合分析与评价,试图通过研究发现问题和差距,出一种较为合理有效的量化评价球队进攻质量的方法,为尽快提高我国的足球水
平,提供理论基础和科学的依据。
1 研究对象与方法
1.1 研究对象
以参加2006年第18届世界杯足球赛32支球队的64场比
赛的进球数、射进指数、助攻、射正球门次数、射门次数、角球、任意球、越位、反击次数、短传、长传、传中次数等12项进攻指标为研究对象。
1.2 研究方法
主要采用录像观察法、文献资料法、数理统计法、专家访谈法以及逻辑分析法等方法来进行研究。
1.3 统计概念与尺度
射进指数:进球数/射门次数×100。
助攻次数:指场上队员传球给队友并且使队友进球得分的传球的次数。
王朝信K -Means 聚类分析对第18届世界杯足球赛各参赛队进攻能力的研究Journal of NS I Vol .23No .12009 
111 越位次数:是指进攻队员在进攻时由于处在越位位置而被
判罚越位的次数。
反击次数:是指一个队在获得控球权后,趁对方重新组织严密防守之前,以迅雷不及掩耳之势,将球传递给中前场有利位置的队员,或个人在中、前场抢、断球后,快速运球直捣球门,创造有利的射门机会的次数。
传中次数:是指进攻队员在边路有目的地把球踢向中路预定方位的战术方法的次数。
2 数据处理
2.1 统计方法与原则
K -Mean 聚类分析是用户制定类别数的大样本资料的逐
步聚类分析,它先对数据进行初始分类,然后逐步调整,得到最
excel打不开
终分类,该聚类方法又称为快速聚类方法。
2.2 K -M ean 聚类分析的计算过程
首先制定聚类分类数定义为5,该系统默认值:迭代次数为10,收敛参数为0.02。其次SPSS f or windows 11.5统计软件确定5个类的初始类中心点。计算所有样本数据点到5个类中心点的欧氏距离,其中欧氏距离(Euclidean D istance )的计算公式为:
E UC L I D =
∑k
i =1(x i -y i )2
其中,k 表示每个样本有k 个变量;x i 表示第一个样本在第i 个变量上的取值;y i 表示第二个样本在第i 个变量上的取值。
然后SPSS for windows 11.5统计软件重新确定5个类的中心点。最后重复上面的两步计算过程,直到达到指定的迭代次数或者终止迭代的判断要求为止。
2.3 K -M ean 聚类分析的数据处理过程2.
3.1 初始类中心点
表1 K -Mean 聚类分析的初始类中心点表
类别12345进球数  1.67  2.00  2.250.330.00射进指数10.2014.7113.04  2.560.00助攻次数0.67  1.60  1.000.330.00射正球门7.677.408.75  4.67  2.33射门次数16.3313.6017.2513.007.33角球次数7.67  6.209.25  3.67  1.67任意球次0.67  1.20  1.250.670.00越位次数  3.67  3.000.75  2.33  2.00反击次数9.00  5.00  5.750.67  2.33短传次数334.00407.60453.50265.30185.70长传次数90.7074.4093.0093.0092.70传中次数
26.30
17.60
24.50
15.30
15.70
  表1是SPSS 指定的初始类中心点。由于需要快速聚类成
去细纹眼霜排行榜
5类,因此指定了5个初始类中心点。
2.3.2 迭代过程中类中心的变化量
表2是K -Mean 聚类分析的迭代历史过程。从表中可以看出总共进行了3次迭代(Iterati on )。第一次迭代后形成的类中心点和初始类中心点的距离(Chang in Cluster Centers )分别为:12.659、18.415、0.000、8.642、14.953。直到第3次迭代后类中心点没有发生变化或者变化很小,距离为0.000,其中初始
类中心点之间的最小距离为50.336。即K -Mean 聚类分析经过3次迭代完成。
五险是哪五种保险表2 K -Mean 聚类分析的迭代历史过程表
类别
12345112.65918.4150.0008.64214.9532  2.51911.8430.0000.0000.0003
0.000
0.000
0.000
0.000
0.000
2.3.3 最终的类中心变量值
表3 K -Mean 聚类分析最终的类中心点位置表
类别12345进球数  1.18  1.73  2.250.640.33射进指数9.7314.1513.04  6.97  4.15助攻次数0.79  1.44  1.000.400.22射正球门  5.73  6.638.75  4.05  2.89射门次数12.2212.8317.259.758.55角球次数  5.28  6.039.25  4.16  3.22任意球次  1.020.98  1.250.870.89越位次数  3.12  3.500.75  2.83  2.56反击次数  4.80  4.03  5.75  3.80  3.89短传次数323.82385.37453.50262.45197.13长传次数97.4190.9093.0093.1485.37传中次数
22.49
19.97
24.50
20.37
19.43
  表3为K -Mean 聚类分析最终的类中心点位置。该表格
和SPSS 输出的第一个表格相比,中心点位置有了一些变化,表明迭代过程中,中心点位置有了转移。2.3.4 最终的类中心点之间的距离
表4 K -Mean 聚类分析最终的类中心点之间的欧氏距离表类别
12
3
4
5
10.000262.1260.0003130.03668.6570.000461.712123.238191.4930.0005
127.526
188.699
256.991
65.874
0.000
  表4是K -Mean 聚类分析最终的类中心点之间的欧氏距离。从中可以看出第3类类中心点和第4类类中心点之间的距离最大,为191.493,第1类类中心点和第2类类中心点之间的距离最小,为62.126。2.3.5 各进攻指标间的方差分析
表5 K -Mean 聚类分析后形成的各样本之间的方差分析表
类别组间平方和自由度组内平方和自由度F Sig .
P
进球数1.56740.1212712.9600.000P <0.05
射进指数53.754412.413274.3310.008P <0.05助攻次数0.85540.094279.1070.000P <0.05射正球门12.
95441.563278.2860.000P <0.05射门次数25.48645.413274.7080.005P <0.05角球次数9.67642.102274.6040.006P <0.05任意球次0.06240.224270.2750.891P >0.05越位次数1.69941.608271.0560.397P >0.05反击次数2.23944.287270.5220.720P >0.05短传次数24891.494330.2522775.3710.000P <0.05
长传次数108.5784144.780270.7500.567P >0.05传中次数
13.915
4
23.832
27
0.584
0.677P >0.05
  表5是K -Mean 聚类分析后形成的各样本之间的方差分析表。从中可以看出:各类间在进球数、射进指数、助攻、射正
112
  Journal of NS I Vol.23No.120092009年第23卷第1期 南京体育学院学报
球门次数、射门次数、角球次数、短传次数等7项进攻指标上均存在P<0.05,结果为差异具有显著性,说明弱队和强队之间的差距主要集中在该7项指标上。由此可见,教练员应该在这7项指标上多下功夫,特别是在平时的训练和比赛中重点强调和分析,来提高球队的进攻能力。因此从表5中各类的因素方差分析来看,将样本分成5类的K-M ean聚类分析基本上是成功的,聚类效果比较理想。同时也表明K-Mean聚类结果具有较高的可靠性和科学性。
3 结果与分析
3.1 结果
核酸码在手机哪里查表6 聚类结果统计一览表
队名x1x2x3x4x5x6x7x8x9x10x11x12类别意大利  1.7114.46  1.29  6.8611.86  6.29  1.14  4.86  5.71322.4101.620.01
法国  1.2911.690.71  5.0011.00  5.860.29  4.12  4.00324.779.023.61
德国  1.8611.50  1.147.0416.14  4.72  1.14  3.00  5.57341.7117.328.91
葡萄牙  1.007.000.717.2914.29  6.29  1.14  2.71  5.29363.996.323.72
阿根廷  2.2020.75  2.00  5.2010.60  5.600.60  4.80  1.80384.6102.018.62
巴西  2.0014.71  1.607.4013.60  6.20  1.20  3.00  5.00407.674.417.62
英格兰  1.007.460.60  5.8013.40  6.000.80  2.00  2.60320.0111.026.81
乌克兰  1.008.930.60  5.2011.20  3.800.60  2.60  3.40288.8118.423.84
西班牙  2.2513.04  1.008.7517.259.25  1.250.75  5.75453.593.024.53
厄瓜多尔  1.2512.5  1.25  4.5010.00  4.25  1.25  2.75  2.25339.093.814.81
墨西哥  1.2510.87  1.25  5.2511.50  5.50  1.00  1.25  3.25318.895.826.51
澳大利亚  1.259.260.50  6.2513.50  5.00  1.00  2.25  2.00334.890.026.81
瑞士  1.008.700.75  6.2511.50  5.50  1.50  2.00  4.75355.0101.323.01
加纳  1.00  6.560.50  5.7515.25  4.250.50  6.25  6.75327.888.319.31
荷兰0.75  6.000.50  6.5012.50  4.75  1.75  3.00  3.75318.8102.820.01
瑞典0.75  6.120.75  6.0012.257.500.75  1.75  4.25268.095.031.54
科特迪瓦  1.6710.200.677.6716.337.670.67  3.679.00334.090.726.31哥斯达黎加  1.0010.710.67  3.679.33  3.00  1.00  3.00  4.67303.797.316.31捷克  1.008.570.67  5.6711.67  5.000.67  4.67  5.33302.3108.022.01
韩国  1.008.330.67  5.3412.00  3.67  1.33  2.00  3.67315.0106.321.01
突尼斯  1.0015.790.33  2.67  6.33  2.33  1.00  4.00  3.33248.798.012.04
沙特0.677.690.67  3.008.67  3.33  2.00  2.00  1.67268.378.312.74
波兰0.679.090.67  4.337.337.67  1.33  2.008.67299.378.022.01
伊朗0.67  6.670.33  6.3310.00  3.000.33  2.33  1.67247.078.023.04
日本0.677.410.33  3.339.00  3.67  1.33  2.67  6.00292.789.716.74
塞黑0.679.520.33  2.677.00  3.67  1.67  1.00  3.00189.073.722.35
克罗地亚0.67  6.060.00  4.0011.007.330.67  4.00  6.67236.781.725.74
安格拉0.33  2.940.33  3.6711.33  4.33  1.00  4.67  6.33216.789.720.35
巴拉圭0.33  2.560.33  4.6713.00  3.670.67  2.330.67265.393.015.34
多哥0.33  3.700.33  4.009.00  3.00  1.00  4.33  5.00231.090.018.04
美国0.33  4.760.33  1.337.00  4.000.33  2.33  5.33278.0109.325.04特立尼达和多巴0.000.000.00  2.337.33  1.670.00  2.00  2.33185.792.715.75
  注:x
1
=进球数;x2=射进指数;x3=助攻次数;x4=射正球门次数;x5=射门次数;x6=角球次数;x7=任意球次数;x8=越位次数;x9=反击
次数;x
10
=短传次数;x11=长传次数;x12=传中次数;以上指标均为场均次数。
  表6为K-Mean聚类最终结果,从中我们可以看出:本次聚类结果第1类有15支球队,占总参赛队的46.875%;第2类共有3支球队,占总参赛队的9.375%;第3类仅有1支球队,占总参赛队的3.125%;第4类球队共有10支,占总参赛队的31.25%;第5类共有3支球队,占总参赛队的9.375%。
在前4名球队中有前3名队伍意大利、法国和德国在第1
王朝信K-Means聚类分析对第18届世界杯足球赛各参赛队进攻能力的研究Journal of NS I Vol.23No.12009 
113
类,第4名葡萄牙在第2类;在第5-8名队伍中第7名英格兰在第1类,第五名阿根廷以及第6名巴西在第2类,第8名乌克兰在第4类;在第9-16名队伍中,只有第9名西班牙在第3类以及第16名瑞典在第4类外,其余均在第1类;16强之后的球队只有科特迪瓦、捷克、韩国以及波兰在第一类外,其余都在第4,5类。以上K-Mean聚类结果表明,聚类结果所反映出的进攻趋势与比赛结果也基本吻合,说明快速攻防转化,进攻能力强的球队取得的成绩相对较好。相反,进攻能力差的球队则难以取得好成绩,但是在
比赛中攻防是相互转化的,在这里我们研究更多的是进攻,对防守不做过多的分析。虽然各个国家队都有自己的技战术风格,足球比赛也有很大的偶然性,但是攻势强大、射门次数多、射进指数高、助攻次数多以及射正球门次数越多的球队其胜率也就相应越高。进攻之优劣主要反映在进球数、射进指数、助攻、射正球门次数、射门次数、角球次数、短传次数等7项进攻指标上,次数多、成功率高者占有优势。就进攻结果而言,射门得分则具体体现在进攻队员创造机会、把握射门机会的射门能力上,但这种效果最终还是全队整体进攻量的积累、质的升华,是球队进攻能力的集中体现。
3.2 分析
表6表明聚在第1类的15支球队,以意大利队、法国队、德国队等为代表,统计表明:这些球队的攻击力是比较强大的,进攻质量非常高,前锋善于把握射门的机会、也能自己制造或为同伴创造射门机会;前卫的助攻能力强,在中前场就开始组织稳固的防守,就地进攻而压迫对手,同时也加快了攻防转换速度,提高了进攻质量;后卫队员在稳固好自己的防守区域的同时,加强了与队友之间的相互协防,寻恰当的时机进行插上进攻,与前卫队员、前锋队员进行相互之间的配合,为中前场队员创造进攻机会,这样三条线之间攻防形成了一体,缓解了后防线的压力,给全攻全守的足球发展趋势注入了新的活力。从总体数据统计上也显示,这些球队的进攻能力是非常有特点的,攻击力也是比较强的。尤其是冠军队———意大利队,他的防守体系非常稳固、坚实,进攻犀利且善于快速反击。
第2类的3支球队,这三支球队为葡萄牙队、阿根廷队以及巴西队,分别位居第4名、第5名以及第6名,从进攻数据的总体上来看,这些球队的攻击力是非常强大的,其进攻能力也是整体性的,同时也具有稳固的防守能力。聚在该类的球队都是世界传统的强队,球员的个人技术非常娴熟细腻,有良好的控球能力,尤其是巴西队和阿根廷队,它们的队员的过人突破能力、随机应变能力、短传渗透能力威胁很大,属于典型的技术流派。
第3类的1支球队西班牙队,从进攻数据的来看,这在本届世界杯上全部球队的进攻能力上来说是很强的,这与他在小组赛中的对手比较弱有一定的关系,由于过早的遇上了法国队,没有进入前八强也在情理之中。统计结果也表明:聚在该类的西班牙队的进攻质量非常高,前锋把握射门机会的能力强、也能自己制造或为同伴创造射门机会;但是中后场的防守不够稳固,防守漏洞太多,经不住法国队的猛烈冲击,从西班牙和法国队这场比赛的全过程来看,西班牙在进攻能力上还占据一定的优势,但是法国的防守更为坚固,强强对抗不止看谁的进攻能力强,更看谁的防守破绽多,可以说本场比赛谁输谁赢都很正常。
第4类的10支球队,以乌克兰队、瑞典队、沙特队为代表,这类球队中多为足球的不发达国家,从聚类结果来看,它们的进攻有一定的优势,进球较少且射进指数较低,说明进攻质量不高。录像观察发现,该球队的进攻多集中在中场附近,很难攻入对方防守的危险地带,缺乏有效的得分手段。
第5类的3支球队,除了赛黑队之外,安哥拉队与特立尼达和多巴队两队都是第1次进入世界杯,属于足球的落后国家,但是能打进世界杯足球赛,这也说明他们还是有一定的实力的,塞黑队本来还是有一定的足球基础的,但是在小组赛中就遇到了阿根廷队和荷兰队,使得进攻能力得不到完全发挥,过早的被淘汰也不足为怪。从数据上看,整体进攻能力较弱,进球不多,射进指数也不高,进攻质量低下,与世界足球强队有一定的差距,很难与之抗衡。
4 结论
1)本文提出的利用K-Mean聚类分析,对32支球队的进球数等12项进攻能力指标进行的聚类分析,与比赛的结果也有吻合之处,这表明应用K-Mean聚类分析法对综合评价球队的整体进攻能力具有很大的使用价值,是一种可靠的、合理有效的、较为客观的、快速量化评价球队进攻能力的方法,且这种方法也很容易推广到其他体育项目的综合评价中。
2)对第18届世界杯足球赛32支球队64场比赛的进球数等12项进攻指标进行K-M ean聚类分析,结果显示各类间在场均进球数、射进指数、助攻、射正球门次数、射门次数、角球、短传次数等7项进攻指标上差异具有显著性,弱队和强队之间的差距主要体现在该7项指标上。
3)以意大利队、法国队为代表的第1类球队进攻质量非常高,进攻时非常犀利且善于快速反击;第2、3类的球队他们的进攻能力是非常强大的,但是重攻轻守,很难走到最后;第4类的球队的进攻能力有
一定的优势,但进攻质量不高,缺乏有效的得分手段;第5类的球队整体进攻能力较弱,与世界强队有一定的差距。
参考文献:
[1] 刘涛.体育统计学[M].北京:体育学院出版社,1990:63-97.
[2] 余建英,何旭宏.数据统计分析与SPSS应用[M].北京:人民邮电
出版社,2003:251-282.
[3] 张力为.体育科学研究方法[M].北京:高等教育出版社,2004:57
-158.
[4] 奚天明.第十三届亚洲杯足球赛进攻行动的统计与分析[J].北
京体育大学学报,2005:133-136.
[5] 张冉,张雪临.第16届世界杯足球赛进攻指标的Q型聚类分析
[J].中国体育科技,1999,35(11):16-18.
张一山女友曝光[6] 麻雪田,王崇喜.现代足球运动高级教程[M].北京:高等教育出
版社,2002:1-7.
[7] The official site for the2006F I F A Word Cup Ger many[E B/OL].ht2
t p://fifawordcup.yahoo
[8] 李平.从第11、12届欧洲足球锦标赛析现代足球进攻战术发展
趋势[J].成都体育学院学报,2005,(5):77-80。
[9] 亚洲足球联合会.亚洲足球教练员C级培训教程(第二版)[M].
北京:人民体育出版社,2005:115-118.
[10]许在华,袁野.对第13届亚洲杯足球赛日本队传球特点及进攻节
奏分析[J].中国体育科技,2005(5):85-87.