足球分析的十大戒律,盘点十大可能误导人真正解读比赛的数据

作者:文章来源:JRS直播网发布日期:2020-03-24 23:01:50

假如是评价一个前锋,那便是进球数、预期进球值等等

这是徐小侠的

第452 篇原 创 文 章

英国网媒《运动家》作者Tom Worville撰文《足球阐发的十大年夜戒律》,盘点十大年夜可能误导人真正解读比赛的数据

1)不要用扑救成功率来评价守门员的能力

例子:本赛季,马丁·杜布拉瓦卡扑救成功率达到73.9%,是英超第八好的门将

为什么会孕育发生误导:

扑救成功率=扑救次数/面对的射门次数

问题来了,不合的守门员面对的射门类型和质量没有体现在这个公式里

比如说,X门将在禁区内被射门10次,Y门将面对的是10脚禁区外的射门假如他们各自扑出了6次,那么两人的扑救成功率都是60%,但显然X门将碰到的寻衅更大年夜

用什么数据代替:

在谋略扑救成功率时引入xGOT(Expected Goals on Target),预期射正进球值,这个数值用来衡量一个时机被打进的艰苦与否,假如这个数值相对高则阐明进球的概率越高,反之则越低这项数据比拟射门次数,会更考量射门的位置以及触球部位

假如一个守门员扑出了50%的必进球,那么纵然他扑救成功率只有50%,他依然是一个异常好的门将而比如利物浦门将阿利松,他本赛季的体现就有些被高估,只管他扑救成功率高达80.4%,排名英超第一,但假如综合斟酌进预期射正进球值,他的Goals Prevented是-1.3,也便是他比预期多丢了1.3个球,这1.3个球是质量平平的射门,他本该救出去的

相反,沃特福德门将本福斯特的扑救成功率只有65.7%,但他的Goals Prevented是+6.2,他比预期多救出了6.2个原先大年夜概率会打进的球假如没有他的体现,现在和降级区同分的沃特福德排名可能继承往下降

2)跑动间隔或冲刺数据不代表努力程度

例子:厄齐尔本日比其他任何一个阿森纳球员跑动间隔都要多,达到了11.2公里

为什么会孕育发生误导:

英超俱乐部从2013-2014赛季开始引入追踪数据,媒体大年夜部分时刻引用的是跑动间隔和冲刺速率,而且用得很多然而,和扑救成功率一样,这两项数据短缺“语境”

首先,赢球和跑动间隔没有直接联系上赛季欧足联关于欧冠联赛的技巧申报,顿涅茨克矿工是32支球队中匀称跑动间隔最远的,他们在小组赛排名第三,然后在欧联杯32强被淘汰出局曼联的匀称跑动间隔是第二少的,但他们打进了八强

其次,赓续奉告冲刺并不料味着就比别人快,很简单,知道什么时刻应用自己的速率才是最紧张的冲要破对方防线,无意偶尔候并不必要跑得比别人快,什么时刻启动、从哪个角度冲破才是关键比起田径比赛,足球更像是一个光阴和空间的游戏

而且,你得综合斟酌进教练对球员的要求、球队的打法、球队的站位、比赛的形势等等身分,跑动和冲刺两项数据对球员的斟酌感化才故意义

着末,跑得更少,无意偶尔候可能反而更有效率——问问梅西

用什么数据代替:

今朝还没有很好的替代品,但除非这些数据在应用时被考量到“语境”,否则意义并不大年夜

3)控球率意义不大年夜

例子:热刺在0比1输给纽卡斯尔的比赛中控球率高达79.8%,这是2003-2004赛季以来英超输球一方控球率第二高的

为什么会孕育发生误导:

Marti Perarnau在关于瓜迪奥拉的《Pep Confidential》一书中写到,控球率只是达到目的的一种要领,是一个对象,而不是目标

控球率是一项应用频率很高的数据,但这项数据并没有什么意义2015-2016赛季莱斯特城以匀称42.6%的控球率赢得英超冠军,上赛季曼城夺冠控球率是67.7%

跟着比赛形势的不合,控球率会赓续变更马竞主场1比0击败利物浦的比赛,他们第4分钟就取得1比0的领先,是以他们着末控球率只有27%假如没有早早进球的话,形势显然会不合

用什么数据代替:

控球率可以奉告你哪一队持有球权更多,但并不能用来证实哪一队比另一队更好,或是更应该赢得比赛假如要阐发哪支球队更值得赢得比赛,xG,预期进球值会是一个更好的数据,它表现的是一支球队创造了若干大年夜概率可以进球的时机

4)不要用抢断次数来判断一个球员的戍守能力

例子:里卡多·佩雷拉是英超最好的后卫,本赛季共抢断119次

为什么会孕育发生误导:

并不是所有球员的戍守都是有形的,而且这项数据可能受球队风格的影响比如一支球队控球少,那么他们自然会有更多的时机铲抢,反之亦然

范戴克每90分钟只抢断0.76次,但没有人会觉得他是一个糟糕的戍守队员

用什么数据代替:

为了更好比较不合队员的戍守能力,可以把数据扩大年夜到对手在场上每1000次触球时,该球员抢断了若干次利物浦中场亨德森每90分钟抢断2.6次,英超中场第15名,但把数据范围扩大年夜后,对手每1000次触球,他能抢断4.6次,是英超这项数据第五好的中场球员

5)不要用拦截成功率来判断球员的抢断能力

为什么会孕育发生误导:

这项数据轻忽了抢断的时刻对方犯规或是自己抢断成功后制造犯规的次数今朝英超抢断成功率最高的边后卫是马丁·凯利,高达80%万比萨卡,光是看比赛大年夜家都邑感觉他应该在顶尖行列,但他的拦截成功率只排在第11

假如引入两个犯规数据的话,真实拦截成功率=拦截次数/,那么万比萨卡的真实拦截成功率是78.9%,英超边后卫第一,而马丁·凯利的排名变成了第29

6)小样本的环境下,不要用预期进球值衡量前锋

例子:菲尔米诺的预期进球值是12.7个进球,但实际上他本赛季英超只打进了8球,他是一个糟糕的遣散者

孕育发生误导的缘故原由:

这项数据更得当用来评判一支球队创造时机的能力,纵然跨度达到一个赛季,对付某个球员的预期进球值来说,依然只是小样本菲尔米诺此前在利物浦的三个赛季,第一个赛季进球数比预期进球值高,第二个赛季低,第三个赛季高

7)不要用一个球员缺席时的胜率来衡量他的感化

例子:本赛季阿森纳在没有厄齐尔的环境下胜率达到40%,比他出场时球队的胜率高

孕育发生误导的缘故原由:

WOWY,With or Without You,更得当更小范围的运动,比如篮球,篮球的声威变更更多,得分更多,单个球员对比赛孕育发生的影响力就更大年夜

足球运动介入人数更多,而且有更多偶尔的身分,比如厄齐尔出场的比赛中,他的球员状态若何,有红牌吗,厄齐尔在比赛中被换下了吗?WOWY这项数据表现不出这些问题

又比如伯恩利的本·梅伊和塔尔科夫斯基都踢满了球队本赛季每一分钟的比赛,他们谁体现更好?谁对球队做出了更大年夜的供献?WOWY这项数据无法奉告我们

用什么数据代替:

更好的法子是根据球员的位置,用更细致的数据来阐发他们,专注他们的义务比如评价厄齐尔,显然是要评估他的创造了,那考量的数据就应该是创造了若干时机

8)不要用传球成功率来判断一个球员的传球能力

例子:菲尔·巴德斯利是英超传球最差的后卫,传球成功率只有63.6%

为什么会孕育发生误导:

球员传球的准确率,取决于他们被要求做什么,以及他们在控球时做出的选择

比如曼城,大年夜部分时刻大年夜部分区域,在压力很少的环境下,他们倾向于应用短传其他球队,比如伯恩利,会更常应用长传

还有些球员,他会被要求更多进行寻衅性的直塞,掉败率自然要比安然的短传给身边的队友高,但不能说他的传球能力就差

9)次数不紧张,转化率更紧张

例子:阿诺德传球不成功的次数比英超任何一个其他球员都多

为什么会孕育发生误导:

金靴奖得主每个赛季的进球次数都不会比射门掉败的次数多,但不要紧,掉败次数并不紧张,更紧张的数据是转化率

比起关注阿诺德掉败的次数,更紧张的是,他是大年夜部分传球都掉败了吗?照样由于他比其他任何球员都考试测验了多得多的传球?

10)不要将出场光阴不合的球员进行对照

例子:阿诺德和麦迪逊并列英超创造时机第二多的球员,均创造了75次

为什么会孕育发生误导:

很简单,上场光阴长的球员有时机进行更多的考试测验

可以调剂为每90分钟的统计数据来对照经由过程这个调剂,诺维奇的埃米布尼亚每90分钟创造3.3次时机,实际上是英超第二好的时机创造者,麦迪逊是2.8次,而阿诺德则是2.6次

TheAthletic《The 10 Commandments of football analytics》

自己感觉还不错的文章,点击打开

“在看”

标签: 控球率 扑救 英超 本·福斯特 曼城 瓜迪奥拉 徐小侠 足球

分享按钮