随着2022年卡塔尔足球世界杯--国际足联锦标赛的开始,研究人员正在展示他们的技能,以帮助足球教练培养球员和战术。

比利时(红色)在2018年世界杯的四分之一决赛中击败了巴西。
上个月,克里斯蒂亚诺·罗纳尔多脸上的皱眉成为国际头条新闻,当时这位葡萄牙超级巨星在曼联和纽卡斯尔之间的比赛中被换下,这时候距离比赛结束还剩18分钟。但他并不孤单。很少有足球运动员愿意教练决定用他们换人,换上新的替补。

卡塔尔

2022年卡塔尔足球世界杯比赛场馆
在即将在卡塔尔举行的足球世界杯锦标赛期间,球员将有一种更基于证据的方式来争论球场上的时间。在终场哨声响起后的几分钟内,比赛组织者将向每位球员发送他们表现得详细明细。前锋将能够展示他们跑动和被忽视的频率。防守者将获得有关他们在控球时对对方球队造成多*麻大**烦和骚扰的数据。

2022年卡塔尔世界杯用球和奖杯
这是数字对足球这项美丽游戏的最新入侵。数据分析现在有助于引导一切,从球员转移和训练强度,到瞄准对手并推荐在球场上任何时候踢球的最佳方向。
与此同时,足球运动员面临着更常见的与宇航员相关的数据审查。可穿戴背心和带子现在可以感知运动,使用GPS跟踪位置并计算每只脚拍摄的次数。多个角度的摄像机可以捕捉到从头球获胜到球员持球时间的所有内容。为了理解这些信息,大多数精英足球队现在都雇用数据分析师,包括数学家、数据科学家和物理学家,他们来自顶级公司和实验室,如计算巨头微软和瑞士日内瓦附近的欧洲粒子物理实验室欧洲核子研究中心。
作为回报,分析师的见解正在改变比赛的进行方式:前锋远距离射门的频率降低,边锋传球给队友而不是传球,教练痴迷于在球场高处赢得控球权——战术转变都有确凿的证据支持教练的直觉。
“大数据开创了足球的新时代,”德国科隆体育大学的体育科学家丹尼尔·梅默特(Daniel Memmert)说。“它改变了球队的理念和行为,他们如何分析对手以及他们培养人才和球探球员的方式。
覆盖所有基地
数据如何改变体育的最著名案例之一来自不同的游戏。迈克尔·刘易斯(Michael Lewis)在2003年出版的《金钱球》(Moneyball)一书中详细介绍了奥克兰田径队的经理比利·比恩(Billy Beane)如何在2002年依靠球员统计数据以微薄的预算提供一支获胜的棒球队。比恩根据有关球员表现的详细数据招募球员,包括以前被低估的测量值,例如击球手上垒的频率。
比恩比那些试图在足球中重复这个把戏的人更有优势。“足球比棒球复杂得多,”梅默特说。棒球是一种自然的停止-开始游戏,一次只有一支球队试图得分,几十年来,棒球统计数据一直被定期收集和大规模研究。相比之下,足球是一种流动且低分地“入侵”游戏(其中领土经常被获得和放弃),记录谁做了什么以及它如何影响结果要困难得多。几十年来,足球统计学家倾向于关注进球和失球,并找到一种方法来建模以进行预测。
这种方法的变体今天仍然用于预测比赛的结果。由英国牛津大学的流行病学家开发的一个数学模型假设进球和失球分布在平均值周围,该模型正确地预测了意大利将在2020年欧洲杯国际比赛中击败英格兰。它还正确地召集了八名四分之一决赛选手中的六名。
这样的成功并不罕见。统计匹配预测比许多人意识到的更准确,牛津大学博士生马修·佩恩(Matthew Penn)说,他开发了2020年欧洲杯模型。
“你想给每支球队一个进攻和防守的力量,你从每支球队的进球总数和对手的相对难度中计算出来,”他说。“你最终会得到这一大组方程来求解这两组优势,然后预测每场比赛变得非常容易。对于即将到来的卡塔尔世界杯,佩恩的模型表明,比利时(在《自然》杂志出版时定价为14/1)最有可能获得著名的奖杯,其次是巴西(见“谁将赢得世界杯?
谁将赢得世界杯?
考虑每支男子球队的进攻和防守实力的统计“双泊松”模型将比利时列为赢得世界杯的几率最高的国家,而巴西在国际足联排名中名列前茅。
|
模型预测排名 |
中奖几率 (%) |
国际足联排名位置 |
|
1. 比利时 |
13.88 |
1. 巴西 |
|
2. 巴西 |
13.51 |
2. 比利时 |
|
3. 法国 |
12.11 |
3. 阿根廷 |
|
4. 阿根廷 |
11.52 |
4. 法国 |
|
5. 荷兰 |
9.65 |
5. 英格兰 |
|
6. 德国 |
7.24 |
6. 意大利† |
|
7. 西班牙 |
6.37 |
7. 西班牙 |
|
8. 瑞士 |
5.29 |
8. 荷兰 |
|
9. 葡萄牙 |
3.78 |
9. 葡萄牙 |
|
10. 乌拉圭 |
3.36 |
10. 丹麦 |
|
11. 丹麦 |
3.17 |
11. 德国 |
|
12. 英格兰 |
2.56 |
12. 克罗地亚 |
|
13. 波兰* |
2.33 |
13. 墨西哥 |
|
14. 克罗地亚 |
1.46 |
14. 乌拉圭 |
|
15. 墨西哥 |
0.67 |
15. 瑞士 |
*国际足联排名第26位;†没有资格参加世界杯。
音高完美
对教练来说,更有趣的是关于球场上事件的信息以及球员如何影响他们。
足球分析师长期以来一直在记录此类信息。最成功的是,一位名叫查尔斯·里普(Charles Reep)的前皇家空军会计师在1950年代的大部分时间里都在英格兰观看比赛,并对投球位置和传球顺序等因素进行了基本观察。里普甚至使用他的数据来分析团队表现并提出战略和战术建议。在伍尔弗汉普顿流浪者足球俱乐部(FC),他帮助引入了一种直接而敏锐的比赛风格,对侧身传球皱眉,并在五年内赢得了三个联赛冠军。
现代技术使这些数据更容易获得和分析,以至于大多数顶级俱乐部和许多国家队在十多年前就开始雇用数据分析师。它的使用深入到足球金字塔。除了攻读博士学位外,佩恩还在牛津城担任兼职数据分析师,牛津城是一家半职业俱乐部,在英格兰系统的第六级国家联盟南部踢球。
许多分析师将伦敦俱乐部布伦特福德足球俱乐部最近的一些成功归功于一种内部算法,该算法对不同联赛的球员进行评级,并帮助球队招募被低估的球星。利物浦足球俱乐部的数据团队,包括曾在欧洲核子研究中心和英国剑桥大学的物理学家,已经建立了一个模型,可以评估球员在球场上的行为是否更有可能进球。在与西班牙豪门巴塞罗那足球俱乐部的合作中,葡萄牙里斯本大学的体育科学家去年发表了一篇关于比赛中不同类型传球机会持续多长时间的分析。
“我认为我们(在牛津城)做得最有用的事情是赛前报告,”佩恩说。“我们查看另一支球队球员的属性,然后制作一些图表来显示他们的比赛方式以及他们如何在控球中移动。然后我会建议一些战术技巧或改变。在最近对阵一支以前保持不败的球队的比赛之前,佩恩的分析发现左后卫的头球数据很差。“所以建议我们的大前锋站在球场的右侧,”他说。牛津赢得了比赛。
这也是经验丰富的侦察员肉眼很容易获得的洞察力。但是,佩恩说,“数据将比某人的意见更少偏见”。
俱乐部不必自己为这些战术分析生成原始数据。相反,他们可以从商业公司购买信息,这些公司编码拍摄比赛,以记录大约3000个主要比赛事件的结果,包括运球,传球和铲球。起初,这些数据是手动记录的,但现在通常使用一种称为计算机视觉的人工智能(AI)来完成。通常,这些数据带有汇总统计数据,例如每个球员的传球完成率。

电视摄像机捕捉到了2019年女足世界杯期间挪威和英格兰之间的比赛。学分:凯瑟琳·伊维尔/国际足联/盖蒂
今年早些时候,英国华威大学数学本科生乔安娜·马克斯(Joanna Marks)与牛津城的宾夕法尼亚大学合作开发了一个模型,利用这些原始数据来评估牛津联盟中所有球员的传球实力——这种详细的分析通常无法在公司提供的原始数据中获得。
“你需要考虑他们尝试什么样的传球。你不能只考虑完成率,因为有些传球要困难得多,“马克斯说。“该模型有助于球队做好准备,因为如果你知道对手在球场的某个区域传球非常好,那么你就知道要注意什么。
拉维·拉米尼(Ravi Ramineni)曾在微软担任数据分析师,然后于2012年转到华盛顿当地的美国职业足球大联盟(MLS)俱乐部西雅图海湾人队(Seattle Sounders)从事类似工作。他的首要任务之一是使用GPS数据来了解球员跑多远,以优化他们的训练和准备课程。“在训练期间收集这些数据,你可以说今天训练太多或太少。你这样做是为了防止受伤。
它有效吗?“当我们应用这些方法时,我们有一些非常好的赛季。但我不知道。这里最难量化的是伤害没有发生。
缺乏确定性引发了所有关于数据在体育成功中的作用的说法的问题:没有对照实验来检查有效性。尽管如此,拉米尼尼说,西雅图的教练们对他的分析持开放态度,无论是在训练中还是在后来判断球员实力时。
“我有机会接触教练,我甚至可以直接和球员交谈,”他说。“在其他俱乐部,情况就不一样了。有时教练甚至不与数据人员互动。
离机动作
分析师现在越来越关注当球员没有球时会发生什么。
“你在足球分析中经常听到的一件事是,我们需要知道球员在无球时做了什么,”拉米尼尼说。
这更加困难和昂贵,因为它需要专用的摄像机,不仅可以跟踪主要动作,还可以关注没有直接参与的玩家,并每秒标记他们的位置约25次。拉米尼尼说,提供这种数据的公司倾向于与国家联赛签署独家协议,这使得外部人员难以访问。
“如果我为MLS寻找来自南美或欧洲的国际球员,我不会知道他们的无球指标,”他说。
近年来,出现了一种更强大的技术,它利用人工智能来预测球员在拍摄的比赛中的动作,即使他们没有被摄像机直接捕捉到。这意味着数据公司可以使用比赛的广播镜头(不受限制地提供)为世界各地的球员提供全面的球内和无球分析。
一个这样的预测模型是由谷歌在伦敦拥有的人工智能公司DeepMind的研究人员与利物浦足球俱乐部的数据团队合作开发的。
“有了这种应用,你可以开始提出有关战术或反事实的问题,”利物浦足球俱乐部研究主任伊恩格雷厄姆说,他辞去了剑桥大学高分子物理学的博士后,开始从事足球统计工作。
“对于比赛中的特定事件,该模型可以产生数千种不同的模拟,说明可能发生的事情。所以,你可以开始说一些关于进攻动作在那个时期的表现如何。
俱乐部的数据团队往往不会分享有关他们正在做的事情的细节或效果如何的信息,因此发布这项工作对利物浦来说是一个不舒服的步骤。但这是与Deep Mind合作的条件。
“利物浦拥有足球界最大和最发达的分析部门之一,我们没有自己构建这些模型所需的资源,”格雷厄姆说。这让他放心,没有其他俱乐部可以做到。
像其他数据分析师一样,格雷厄姆不愿意将球场上的成功直接归功于他。“足球是一项高方差的比赛,所以球队经常在不该输的时候输,在不该赢的时候赢,”他说。“在很多方面,当球队表现不佳时,我们的工作会更容易,因为我们的分析经常表明我们打得很好。如果我们继续这样踢下去,我们将赢得本赛季预期的比赛数量。
DeepMind的计算机科学家卡尔·图尔斯(Karl Tuyls)表示,镜头外建模工作是创建虚拟的人工智能驱动助理教练的第一步,该助理教练使用实时数据来指导足球和其他运动的决策。“你可以想象人工智能看着上半场的表现,并建议改变阵型,这可能会做得更好,”他说。
Tuyls补充说,这种方法在球场之外也很有用,例如在繁忙的城市街道上对自动驾驶汽车和行人的轨迹进行建模。
下一步是什么?像所有优秀的科学家一样,参与足球数据的专家强调,仍需要更多的研究。前微软数据科学家莎拉·陆克文(Sarah Rudd)在为伦敦俱乐部从事分析工作近十年后于去年离开阿森纳足球俱乐部,她渴望赛车产生的大量遥测数据,这些数据有助于支持团队调整和提高其性能。
“我们总是看着一级方程式赛车,并说拥有这种水平的数据会很棒,”她说。“足球中还有很多东西没有被衡量,或者正在被衡量,但我们还没有弄清楚如何从中获得洞察力。
下一个进步可能是显示球员方向的数据,甚至他们如何转移体重。“跟踪数据可能仍然没有达到人们想要的精确度,”陆克文说。“你还没有学会球员为让防守者失去平衡或让守门员稍作停顿而做出的步吃或体重转移。
即使是利物浦的人工智能驱动的分析也可能被对球员位置的不完全了解所迷惑。“模型可能会说这个球员做了一件坏事,因为他应该在这一点上开始跑步,但他没有,”格雷厄姆说。“但那可能是因为他刚刚被绊倒,躺在球场上。
随着现代足球淹没在数据中,数字如何改变了比赛?
“我认为招聘可能是你获得最大收益的地方,”拉米尼尼说。然而,另一个领域是定位球的策略,当球队在比赛暂停后获得任意球时。
从数据分析中得出的一个明显教训是,球员不应该在远离目标时投篮。“如果你看看世界上任何一个联赛,十年前球员投篮的距离要高得多,”拉米尼尼说。“这一切都是因为数据分析人员开始说:'你为什么要从那里投篮?只有2%的几率!"
他补充说,许多球队现在也不鼓励球员尝试向禁区长传,因为统计数据显示大多数都是毫无意义的。
随着生成的数据量持续增长,就业机会也会增加,拉米尼尼说。“我认为数据足迹现在遍布这项运动,没有回头路了。
我是热谈哥&革命的老农
欢迎关注和点评,您的关注和点评是我们长期耕耘的最大动力。
#2022世界杯#