Adam Crafton / 2020-04-14

经纪人基斯-普勒斯马(Kees Ploegsma)眼见他的客户德佩在曼联流年不利,挣扎不堪,决定冒险采取一种激进的手段尝试拯救德佩的职业生涯。
在穆里尼奥手下,范加尔签来的德佩一下子就失宠了。2016-17赛季上半段,德佩没有捞到一次在联赛中首发的机会,他的状态和信心跌到了谷底。普勒斯马也是在这时决定放弃足球经纪人惯常的“包装推销赚中介费”手段,转而拥抱大数据科学,以此为根据帮助球员选择最佳的下家。
普勒斯马与大数据公司SciSports进行了多次会谈。SciSports的创始人兼首席创新官(CIO)吉尔斯-布劳沃(Giels Brouwer)告诉TheAthletic:“吉尔斯希望我们一同前往曼彻斯特和德佩谈谈。我们去了他家,坐在沙发上一起观看了皇马和多特蒙德的冠军联赛比赛。我们需要了解为什么他无法融入曼联的战术风格。他告诉我们,他需要信心,也需要成为球队重要的一份子。接着他说,‘我需要自由发挥的空间’。”
成立于2013年的SciSports为客户们提供多种服务。第一种是面向俱乐部的在线球探系统服务。该服务收录超过3600家俱乐部的9万余名球员的各种数据,俱乐部可以支付订阅费用来收到每月报告;同时,该公司也为经纪人提供类似的服务。除了这种数据库服务外,该公司也为俱乐部和经纪人提供定制报告。在德佩的案例中,该公司需要回答德佩的一个简单问题:你们能不能通过大数据研究,告诉我最合适的下家来拯救我的职业生涯?
布劳沃说道:“我们研究了德佩在埃因霍温和荷兰国家队的比赛,发现他在曼联期间被要求承担了相当多的防守任务,因此无法在进攻中自由发挥。接着,我们把他后来提到的诉求比如‘我希望在左边路突破’,‘我希望新球队的比赛节奏比较快’,‘我希望我面前有足够的空间’等等综合起来,通过我们设计的算法建立了一套数学模型。最终我们找到了五家他可能比较适合的俱乐部,以及能够满足他的诉求的教练。而里昂是我们算出来的最优解。”
普勒斯马带着报告就奔向里昂,对里昂的技术官员详细阐述了德佩有多么适合球队。而由于德佩在曼联发挥不佳,身价也有所下跌,急于止损的曼联自然很愿意和里昂达成交易。虽然埃弗顿,费内巴切,德甲、西甲和意甲强队都有意德佩,但报告指出,德佩和里昂才是天作之合。德佩至今已经在102场法甲中打进43球送出32次助攻,同时也重新收到了荷兰国家队的召唤。
经纪人和数据分析师之间的合作日趋普遍。假设有一名年轻的曼联球员,他的经纪人可以要求一位数据科学家提供该球员的个性化报告,比较其当前水平和潜力,然后与欧洲相似球员的各项数据和合同待遇作对比,接着再进行研究以求在新合同的谈判中更加有利可图。
单单一家SciSports就和至少10家独立经纪公司签署了合作协议,其中就包括比利时的A-Group——旗下有费尔通亨和穆萨-登贝莱为代表的多名球员,以及荷兰的SEG经纪公司——打理着德佩(之前还有范佩西)等球员的事务,还有拥有阿尔德韦雷尔德和默滕斯的Stirr Associates公司等等。
布劳沃解释道:“我们通过多种方式协助经纪公司的工作:首先帮助他们寻找合适的球员,配置成合适的球员(形式的)资产,同时允许经纪人使用球探报告说服球员,使球员认可这份报告已经对他们进行了深入的研究;接着是帮助这些球员找到最合适的下家。经纪公司在拓展自身业务的时候也会与我们进行交流。比如他们计划在斯洛伐克开设办公室时,他们就会向我们要斯洛伐克最炙手可热的10名新秀的报告,我们就可以设计一套算法来满足他们的需求。”
SciSports不是唯一提供这些服务的数据服务商,Analytics FC公司作为竞争对手同样提供了类似的平台。创始人杰雷米-斯蒂勒(Jeremy Steele)表示,公司与 First Access Sports经纪公司的紧密合作使得他能够为客户提供定制化的服务,譬如公司已经为切尔西的哈德森-奥多伊的合同谈判提供了帮助,之前还有耶雷米-博加(Jérémie Boga)和雅尼克-博拉西(Yannick Bolasie)也曾从相似的服务中获益。
然而,大数据的参与也使得俱乐部和经纪人的谈判可能变得更加困难。如果大数据分析指出经纪人——或者更直接地说,他们的最终客户——被球员的身价给迷惑了呢?
斯蒂勒表示:“我们需要搞清楚身价和实力的关系,毕竟我们也不希望回过头去说,啊,那个球员很不咋的。我们不能说谎,数字不会说谎。如果你问我们欧洲最有潜力的新秀是哪些,然而你收到的名单里没有得到你想要的结果,我只能说,很抱歉,这种情况下数据仅供参考,最好不要盲目采信。”
布劳沃对此表示同意:“我们最近对一位球员直白地说,‘我们无法为你找到下家’。如果我们为了安慰他,告诉他有五家俱乐部有意,但实际上没有俱乐部对他有兴趣,那么他的经纪人就不会再找我们要报告了。有的时候我们会对经纪人说,‘不要为了要报告而来要报告,结果你们不爱听’。也许有人不爱听这话,但经纪人也是分两拨的。有一拨喜欢瞅机会捞一笔就跑,还有一拨希望成为球员的职业生涯规划师,希望尽可能延长他们的职业寿命。当然,还有些球员挺难伺候的,因为他们都认为自己是最好的球员。于是他们的经纪人就可以通过我们详尽的数据报告来判断下一步该怎么走。比如去皇马前需要准备些什么,或者为了加盟尤文图斯,先去亚特兰大打出名堂。我们的报告有助于从客观的角度来安排最好的职业规划。”
事实上,经纪人们正在努力以相似的方式赶上“大数据足球”的列车。在过去的二十年中,大数据分析在足球世界的应用得以迅猛发展。这对于足球的各个方面都至关重要——球员的表现,球员的状态,球队的战术,定位球战术和球员转会。利物浦不仅在市场开发上大获成功,也在大数据的应用积极推进着各方面的进步。俱乐部足球总监迈克尔-爱德华兹(Michael Edwards)的背后,有着拥有剑桥大学理论物理学博士学位的伊恩-格雷厄姆(Dr Ian Graham)和曾在哈佛大学欧洲研究中心(CERN)进行研究工作的哈佛大学高材生威尔-斯皮尔曼(Will Spearman)这样的强力援手。
足球在某种意义上,终于成为了大数据浪潮中的一份子。不过,在足球数据大爆炸之前的很长一段时间里,足球世界也不总是这样。
在社交媒体初具规模的时候,战场就已在酝酿。“可以这样来想象,” 任职于英超前四俱乐部的一位球探这样解释道,“学校分两种,职业学校和学术学校;球探也分两个派别。用电影人物举例的话那就是,你希望成为《曲线难题》(Trouble with the Curve,又名《人生决胜球》)中柯林特-伊斯特伍德(Clint Eastwood)饰演的古斯呢,还是《点球成金》(Moneyball)中布拉德-皮特饰演的比利呢?”
如果你没看过这两部电影,那么请容许我先简单介绍一番。伊斯特伍德饰演的古斯-洛贝尔(Gus Lobel)是一位传统派的老球探,以自己的方式如独行侠一般在各处运动场间巡回观察球员,坚决*制抵**在他眼中“没有灵魂”的数字化现代社会对棒球的影响。而布拉德-皮特试验的比利-比恩(Billy Beane)则使用精准的统计学模型以低廉的价格招揽未被发掘的璞玉。在很长一段时间里,这两种流派一直水火不容,有人认为数据分析师就是被请来毁灭足球的。
在千禧年到来之际,“第一个吃螃蟹的人”震动了足坛,他们的存在也终于开始被人们所感知。成立于1996年的Prozone的第一个大客户是时任德比郡助教的史蒂夫麦克拉伦,他也是第一位真正重视球员追踪系统的教练。Prozone在德比郡主场四周设置了八台摄像机,用以从不同的角度收集潜在有用各项数据。麦克拉伦在成为弗格森的助教理后,曼联也成为Prozone的第一个付费客户——不过条件是如果曼联在1998-99赛季赢得任何一个奖杯,曼联就承诺支付50000英镑的费用(当然,该赛季曼联举起了三冠王)。到2000年末,又有6家英超俱乐部与Prozone签约。而在其他国家,另一种形式的数据采集也开始出现。统计公司Opta诞生了。
Opta创始人艾丹-科尼(Aidan Cooney)最近谈及创业早期作为“非官方合作伙伴”时是这么说的:“足球数据分析从出现到被接受和广泛应用是一个缓慢的过程。当时大多数媒体都还没有准备好接受“球员表现数据”这个概念。我认为,如果对球员在球场上的表现进行定量分析,然后将其整理成可视化的报告给观众看,媒体就可以使读者与比赛的联系更加亲密,并吸引更多的球迷来观看比赛。”
当他把他的报告呈交给《每日镜报》时,他被指试图将足球“美国化”。他说:“所谓的‘美国化’,他们的意思是整出一大堆乏味的数据丢给读者看就好比在整一张乏味的公交时间表。这就是欧洲人认为美国式的体育所呈现给观众的东西。不过,我们动了动脑筋,我们说,我们不是单纯地提供数据,我们是通过数据来给大家讲述一系列故事,这可以成为人们茶余饭后的谈资——那种能成为噱头的故事(water-cooler moment)。当《点球成金》上映之时,我买了20份DVD寄给时任的每一位英超主教练,并附上一封‘希望我们有机会可以谈谈’的亲笔信。不过我收到的回复基本都是大大的‘你傻啊’。新事物一开始总是不太容易被接受。但我还是认为,视频分析总会有夸大之处,合理使用数据才更加有效。”
科尼的营销并不太成功。他说:“要知道,足球比赛得分并不多,很多时候需要运气,毕竟足球是圆的,球场上什么都可能发生。在其他项目中,各项因素的相关性更强,也更容易得出因果关系。棒球和板球就是如此。在早期的比赛中,有那么一些球员能打出很高的离群值(outlier)。在《泰晤士报》拥有的Fink Tank专栏的编辑丹尼尔-芬克尔斯坦(Daniel Finkelstein)看出了其中的价值。当然也有其他编辑看到了这些,但可能还没准备好发掘这些价值千金的数据。”
到了2002年世界杯前夕,芬克尔斯坦作为《泰晤士报》专栏的政论作者坐进了广播电台。当听到亨利-斯托特博士(Dr Henry Stott)介绍他自研用于预测足球比赛结果的学术模型时,他颇感兴趣。
芬克尔斯坦对TheAthletic说:“我听完后想道,‘当然,这就是您计算足球比赛结果的方式,您也会使用手头的数据模拟并创建模型’。第二天我把他的模型带到了报社,对同事们说我们将用教授的部分数据来为我们的世界杯数据库作补充。也许很多人不相信,但根据教授的数据,我们模拟出的结果是塞内加尔有25%的机会可以击败卫冕冠军法国。而结果正是1-0。不过,如果结果不是这样,那么在此之后就没有人会对我们的数据感兴趣了。最后,我们因为这个拥有了一个专栏。”
由于大部分转播商,记者和俱乐部没有能力进行数据分析,Fink Tank每周一次的数据分析成为了大部分人成为“Excel球迷”的契机。芬克尔斯坦继续说道:“这听上去确实夸张了些,但我们确实感觉到我们成为了‘新式足球报道’的弄潮儿。在我们早期工作中遇到的唯一一个了解平均水平概念的人是温格。他会说:‘我对赢得下一场比赛不感兴趣’。’ 没错,作为一名主教练,你应该对赢得一系列的比赛感兴趣。我们除了预测,还会写了一些有关足球奇闻或传说的专栏。 我最喜欢的是,‘半场休息之前丢球是最糟糕的吗?’ 从统计学上来说,答案是否定的。我还记得那次我与伊恩-赖特(Ian Wright)的精彩对话,他说:‘不,在半场休息之前丢球的确是最糟糕的,因为乔治-格雷厄姆(George Graham)会在更衣室给我们狠狠吹风。’ 阿勒代斯对我们的这些报道很感兴趣。有人光记得我们的报道内容而忘了我们的专栏,他就会说:“哦,是Fink Tank专栏的内容啊!”
“许多人认为这样的事情既有趣又离奇,但对于*彩博**商来说,这是他们设计*率赔**的要素之一。有人为兰开斯特大学经济系写了一篇论文,论文展示了我们(大数据公司)的数据模型的计算结果是如何在特定的一段时间内击败了*彩博**公司的精算师们的。这篇文章运用了我们的模型对该时间段内每一场英超联赛,冠军联赛或大型国际比赛进行了概率计算,但实际上我们的一个模型可以为欧洲的每场比赛计算概率。我们坚信其毫无偏见的立场能产生看似冰冷却高度可信的数据。我是切尔西的球迷,我记得我计划去看切尔西在2004-05赛季客场对博尔顿的比赛(2005年4月30日),只要切尔西赢球,就能提前3轮赢得英超联赛冠军。我对我的朋友说,那天我们有63%的机会赢得比赛,所以我们应该去博尔顿。除此之外,我没有其他理由。我通过数据分析逐渐了解足球。既然你不会在没有数据的情况下分析其他任何事物,那为什么还不对足球进行大数据分析呢?”

阿勒代斯从一开始就乐于拥抱新技术和大数据时代。
芬克尔斯坦还提出了一系列假设,给数学家们设立了一堆研究课题。斯托特曾经是奥利弗-怀曼论坛(Oliver Wyman)的主管,伊恩-格雷厄姆也曾在他的子公司决策科技(Decision Technology)任职。在任职期间,格雷厄姆就是做这些研究课题的,如今他成为了利物浦的调查研究主管。据《纽约时报》报道,克洛普就任利物浦主帅不到三周,就认为格雷厄姆是球队不可或缺的一份子了。
2014-15赛季,克洛普还在执教多特蒙德。2014年9月20日,多特蒙德客场0-2不敌美因茨。格拥有剑桥大学理论物理学位的格雷厄姆虽然没有看过这场比赛,但他通过自己的数学模型研究了这场比赛,在攻入对方半场和创造机会方面做了特别研究,最后得出多特蒙德理应赢下这场比赛,接着他就把研究结果整理成报告送到克洛普的办公室。事实上,格雷厄姆的算法本来是用来帮助利物浦的老板们决定下一任的主教练的。他通过算法向老板们演示了克洛普的球队——尽管那个赛季多特蒙德仅仅排名第7,但是就多特蒙德的整体表现而言,他们完全可以拿到亚军的位置。
过去,俱乐部绝不会指望不看足球的人来决定足球方面的事宜,而现在这样的事态已经习以为常。利物浦的一位消息人士解释了格雷厄姆的工作:“他和他的团队通过一系列算法分析各种趋势,查找能够适应球队体系的球员。接着,我们会把这些要求传给高级球探,而克洛普则会从高级球探的报告中筛选他需要的球员。这些研究人员实在不可思议,和他们下棋我是铁定下不过的。更令人惊叹的是他们可以计算出对手移动和控制球的速度,这样我们就可以找出对手的‘阿喀琉斯之踵’,朝他们最弱的环节不断施压。”
芬克尔斯坦回忆起和格雷厄姆的合作时光时说道:“Fink Tank的许多工作都是由他驱动的。伊恩,亨利和我都十分谨慎地对待这些数据。我们用于谈论足球的语言对足球十分重要,我们也能理解到单纯观看比赛所无法了解到的事物。我们也很快认识到门将在财务价值上容易被低估,因此我们毫不惊讶于门将的转会费也可以高到6000万镑。另外举个例子,角球的成功率其实很低,因此角球的价值远远不如高质量的传球——而后者事实上被低估了。”
“俱乐部很快就跟上了大数据的潮流。伊恩和亨利与热刺签订了顾问合同帮助热刺寻找合适的球员,而这也是为什么热刺当时招揽范德法特的缘故。伊恩后来去了利物浦,而他也是利物浦球迷。这是一段非凡的故事。当芬威体育买下利物浦后,掌门人J.W.亨利来到了决策科技公司,希望该公司能为Fink Tank撰文的同时也为利物浦提供服务——亨利也是看了《泰晤士报》的这个专栏才对此感兴趣的。然而当时公司和热刺有合作,亨利也不能直接插手。于是伊恩以个人身份,带着所有人的祝福去了利物浦工作。他在公司积累了10多年的数学建模经验,利物浦真的是挖到了一个大宝贝。”
本-史蒂文斯(Ben Stevens)是水晶宫绩效和招聘分析部门的主管——这是许多俱乐部见到利物浦通过大数据获得成绩后,纷纷设立的部门。他说:“当利物浦雇用数据科学家进行工作时,许多人都对此强烈反对。但是有些俱乐部意识到他们内部也可以完成这项工作。我们虽然也使用大数据平台,但我们还邀请了一位数据科学家、伦敦经济学院(LSE)的顶级毕业生鲍比-绍贾伊(Bobby Shojai)协助我们工作。 他太聪明了。虽然他不会观看任何视频或分析足球本身,纯粹是通过数据分析;同时他完全是金融背景出身,没有足球环境的熏陶——尽管如此,但鲍比每天都能让我震惊。”
不过,我们需要搞清楚的是,数据科学和数据研究不是一回事。数据科学家需要结合人工智能,计算机科学等工具,在数据分析师与视频分析师一同研究和呈现最终数据之前得出结论。 数据科学家可能会创建一系列数学模型来模拟结果,但数据分析师随后会将其转换为体育主管或教练组可以理解的报告以供解读。近年来,数据分析师的职位日趋关键。
史蒂文斯解释道:“十年前老学院派的迈克尔-爱德华兹(Michael Edwards)为朴茨茅斯工作期间作出了卓越的贡献,如今他是利物浦的体育主管;安迪-斯科尔丁(Andy Scoulding)在结束富勒姆的数据分析师工作后去了流浪者担任球员招聘主管;劳伦斯-斯图亚特(Lawrence Stewart)的背景是球员表现分析,现在则在萨尔茨堡红牛担任球员招聘主管。我在水晶宫也换到了这样的岗位。我们的工作不总是一成不变的。克里斯-戴维斯(Chris Davies)曾是罗杰斯执教莱斯特城期间的助教,但我和他第一次见面时,他成了斯旺西的数据分析师。”
那么,作为数据分析师最初的那段日子又是什么感受呢?史蒂文斯微笑道:“那些老学院派的分析师们需要一点时间完成痛苦的转变。当然,那样的日子我是不想再来一次了,但那也是难忘的一次成长仪式。我们也许会被问,‘你怎么有胆子跟我这么说?你懂什么足球?’ 对很多大学刚毕业,自认为很懂足球的人来说,艰难一些的经历能让他们快速成长。如此一来,我们就筛掉了一批缺少毅力又没有良好心态的人。你来到俱乐部,作为俱乐部部门的一员,你可能会受到很大的压力。每当我看到一些数据分析师抱怨这抱怨那时,我总会回想起过去的苦日子。
“那时候的任务可不轻松。我毕业后就作为南安普顿青训学院的实习生工作,2008-09赛季开始为一线队服务,从此我的生活开始巨变。那时候我们还在使用VHS录像带,每到一个客场都要带上一盒,赛后我需要把录像翻录成DVD。我们还用SCSI硬盘,等比赛结束后,你需要把东西整理到硬盘上,等着骑着轻便摩托车的家伙来取,他再把录像送到利兹的ProZone公司。那边会在24小时内整理完毕再把东西寄回到俱乐部。那时候可没有现在这么发达的网络。有的客场没有快递员,所有人都在教练那边等着你和你的东西,等不到就回不了家。
“那是的南安普顿,我所在的部门只有两个人。电脑坏了,是你的锅;数据错了,也是你的锅。如今我们突然有了许多同事和分析师,我们可以全方位无死角全天候地观察、分析,甚至可以即时把我们的分析传达到替补席。”
如今,戴着耳机的数据分析师在场边与教练组交流的场景已经司空见惯。史蒂文斯回忆道:“我曾经戴着耳机和阿勒代斯对话,那场景回想起来可滑稽了。我戴着耳机欢乐地看着比赛,突然间他就毛了,朝着你的耳朵疯狂吹风。我就在想,‘他好像朝我说了什么,但他说的是啥米碗糕?’ 我礼貌地问道:‘头儿,您刚才说了些啥?’ 他再次朝我吹了一阵风,就走开了。我赶紧拿出笔胡写了点什么。他显然以为我是在摸鱼!”
长期以来,挑拨起数据派和观察派之间的矛盾都不是什么难事。不过近期受访者都表示,两派人员之间早已不是那么水火不容的状态了。还是拿利物浦举例,他们虽然有一位哈佛核物理学家孜孜不倦地研究数学模型,但也派出大量球探在全世界的野球场上发掘苗子。不过,与其说他们是球探,倒不如说是“拓展专员”——他们要与当地俱乐部和经纪人搞好关系,以免意中人被竞争对手横刀*爱夺**。
利物浦的数据分析人员和数据科学家在忙着剪辑视频片段并创建模型时,利物浦仍然有众多球探在世界各地奔忙。例如,利物浦的一名球探被指派“观察即将交手的对手”多达23次,才能获得足够的可写入报告的依据,然后才将其馈入分析。同时,是球探们的肉眼而不是算法指出布莱顿在防守任意球的时候,人墙总是倾向于跳起。于是2017年12月2日利物浦客场5-1大胜布莱顿的比赛中,库蒂尼奥主罚的任意球一转“桃花影落飞神剑”的风格,转而打出一记“贴地斩”从人墙下方攻破布莱顿大门。同时,表现最好的俱乐部往往能将各部门有机且和谐地联系在一起。接受本报告采访的人都没有建议将数据科学用于招募球员的唯一依据。
前Opta市场营销总监西蒙-巴努布(Simon Banoub)告诉“非官方合作伙伴”:“过去我们曾认为书呆子和‘足球专家’泾渭分明,毫无关系,而现在,时代变了,两者的界限已经不再清晰。”
他笑道:“我还是感觉我们所做的一切都是告诉客户不要仅凭表面现象就武断地下结论。不过,现在数据专家和传统球探所谓的‘争端’都是好事者的炒作,他们事实上是相辅相成,互相促进的。比如最好的数据分析师就像是顶级的‘翻译’,他们不会对着教练大谈算法:他们从浩如烟海的数据中找到需要的结果,再转化成简单易懂的语言整理成报告交给教练或者球员招募部门,随后一级一级往上传递。如此一来,文化的隔阂也就不复存在。俱乐部高层在听完经纪人口若悬河的推销或是‘第六感’描述后,再看看这份作为尽职调查兼顾了谨慎性和完备性的报告,就可以决定是否签署这份可能价值数百万甚至数千万的合同。”
数据专家的作用很简单,大部分俱乐部都无法把球探派到每一个角落(FM里没有人能把球探网刷到100%),依靠数据专家他们可以省下不小的球探费用。 曼联是其中一个比较极端的例子。自弗格森退休后,他们朝30多个国家派出了超过45名球探,工资表的名单显得特别长。但更多俱乐部有着不同想法。他们选择订阅一些专精视频分析的网站和App比如Wyscout,Scout7,InStat等,它们包含了超过20万个全世界范围内的比赛视频——使得他们可以足不出户便阅览天下。当然,他们也会选择数据分析软件比如SciSports和Analyics FC。这两家明面上是对手,但却也经常坐下来相互交流经验,进行头脑风暴。
Analytics FC公司为利兹联,西汉姆联,西部拉面王以及诸多参加欧冠联赛的俱乐部提供服务(出于保密原因此处不便透露其他俱乐部)。创始人斯蒂勒在2019年冬季转会期开启前给利兹联的体育主管维克托-奥尔塔(Victor Orta)去电,表示他找到了一位“冠军联赛级别的明星球员”。
斯蒂勒回忆道:“对我们而言最好的例子是丹尼尔-詹姆斯(Daniel James)。尽管在最后时刻,我们的转会谈判因为斯旺西那边的缘故最终没能成行,但他后来在曼联发展得很好。我们观察他八九场的英冠比赛,就认为他是利兹联必须马上争取到的球员。维克托当时回应道:‘我勒个去,你确信?’我们说:‘是的,绝对确定’。于是他们立刻着手经办转会报价事宜。维克托非常信任数据科学。”
那么,斯蒂勒的这一套算法“看到”了什么?要知道,这个电话打完以后,我们才在足总杯的比赛中见证了詹姆斯一个人就搅得曼城后防鸡犬不宁。斯蒂勒说:“我们的数据是基于‘预测分析’的。我们为CEO们介绍的时候会强调:数据统计是基于历史数据给出的结果。这些数据直接告诉我们的是球员过去的表现,但我们会预测哪些球员未来会表现得更出色。我们的算法会指出,如果这个球员继续怎样怎样,那么他未来可能为成为什么样什么样。我们的算法和利物浦使用的那一套很像。我们设立了一个总体框架,该框架考虑了球员的每一个动作。比如,‘球员在中圈拿球时,他的得分概率是0.0001%;而当他把球长传到禁区,前锋拿到了皮球,那么球队的得分概率就增加到了2%’,等等。无论得分概率在动作前后的变化有多大,最终都是增加了球队的得分概率。而球员其他的动作都会对球队的得分概率造成正面或负面的影响。 ”

去年还在斯旺西的丹-詹姆斯惊艳了数据分析师。
斯蒂勒的个人背景也颇为有趣。他原本是切尔西的教练,带过年轻的芒特和亚伯拉罕。后来成了布伦特福德的球探,最后成立了自己的大数据公司。在利兹联体育主管奥尔塔的引荐下,斯蒂勒成为了同一老板旗下三家俱乐部帕福斯FC(Pafos FC),里加FC和莫斯科罗迪纳(Rodina Moscow)的体育主管。得益于他过去的教练经历,他可以将自己对足球的独特嗅觉和数学建模有机结合。
不过,斯蒂勒也表示:“大数据也不是万灵药,你也不可能一加入‘大数据浪潮’就次次都能签下顶级球员。大数据更像是通过降低风险的方式使你获得一定的比较优势,许多俱乐部也是通过大数据来进行球员的初筛。你可以使用Analytics FC提供的TransferLab中的软件包,从多达90个联赛的数据库中通过各种条件筛选出你想要的信息。也许你会说,‘我可以通过球探团队来筛选这些信息啊’,并不是这样,我们的数据更加‘全球化’。当然,这也不是说有了这个数据库,我们就不需要传统球探团队以及和经纪人们的关系网了。”
在克里斯托弗-比尔曼的著作《足球骇客》(Football Hacker)中,他详细描述了多特蒙德首席球探斯文-米斯林塔特(Sven Mislintat)招揽到莱万多夫斯基,香川真司和奥巴梅杨的成功故事。多特蒙德只有10位球探,相比其他冠军杯八强常客而言少得多,但他们的球探显然效果更佳出色。2017年,阿森纳花费了超过100万镑的违约金才把他挖来担任球员招募部的总管。比尔曼写道,多特蒙德每年会收到超过2500份球员报告,因此他们需要更强大更高效的“过滤器”。有些豪门已经开始自行研发自己的数据库和算法,但更多的俱乐部还是选择Analaytics FC或者SciSports的服务。
在马德里的一家酒店大堂里,一个二十多岁的年轻德国人似乎看上去游手好闲。他风趣幽默,拥有经济学和管理学的几个硕士学位,而且不夸张地说,他是一个钻石级卖家。他是正SciSports的奥地利,德国和瑞士地区经理西蒙·罗德(Simon Rodder)。在这家酒店,Transfer Room正在组织一项活动。Transfer Room是可以使俱乐部之间可以直接协商转会并最大程度地减少经纪人参与的一个平台。罗德意识到将会有150多名俱乐部代表出席,他需要和每一位代表搭话推销,将自己的公司推向欧洲知名的俱乐部。
我们做下来,罗德拿出了笔记本电脑为我们演示软件——专业版的“FM”变成了现实。罗德解释道:“我们和超过50家俱乐部进行合作,包括里昂,阿贾克斯,比利时国家队。而我个人则为巴塞尔,法兰克福,沃尔夫斯堡和帕德伯恩提供技术支持。”
“帕德伯恩的主教练曾说,他们的成功很大程度上要归功于SciSports。他们还在德丙的时候就选择了我们,虽然预算很少,但他们相比于同级别的对手要更加聪明(所以升到了德甲)。看看他们都是从哪里签来的球员!如果他们还是按老方法派遣球探,那么以他们小小的球探网绝不可能触及到那么远的角落。”
那么这个软件是如何实现其功能的呢?“我们首先筛选出一个数据表格,比如,英格兰的前6级联赛,德国的前4级联赛,以及巴西的前4级联赛。‘数据跟踪’下的联赛中每一位球员都尽在掌握。总体上而言,比较简单算法可以跟踪球员在球场上的表现对球员的影响。我们与WyScout合作拍摄比赛视频,然后我们会处理这些数据以简化俱乐部之后的分析流程。比如说,你想要拿莱万多夫斯基作为模板,为你所在的德乙球队寻找一名类似的球员。我们的算法不仅可以提供球员当前表现的指标是否符合你的要求,而且还可以预测球员是否已经‘潜力到头’,可以跟踪该球员过去六个月的发展情况。
“这就像在办公室里足不出户就能有一个‘适合球队的球员名单’,然后你就可以派遣球探去观察名单内的球员,而不是像没头苍蝇一样看一场比赛换一个地方。用大数据超越你的对手吧。”
我作为模拟客户,希望能“试用”一下罗德的算法找出和莱万多夫斯基类似的球员。软件的搜索很快,虽然我们可以输入更多具体的条件,但仅仅这样就能找到相当多符合条件的球员。“米利克,卡斯珀-多尔贝里(Kasper Dolberg),吉鲁,卡鲁姆-威尔逊(Callum Wilson)都和莱万的特征类似,” 他指着屏幕说道。其中威尔逊相当值得关注。英格兰媒体似乎很惊讶这个伯恩茅斯球员为何能得到切尔西和曼联的青睐,然而研究表明他拥有成为天才球员的许多技能包。
不过,如果单纯是买个数据库,为什么俱乐部不买便宜得多得多的FM呢?布劳沃表示,许多俱乐部的确是这么做的。但他也认为:“尽管许多俱乐部因为成本原因会这么选择,但FM和FIFA都是业余观察员提供的数据,这就容易带着主观倾向——毕竟球迷总会更偏爱自家球员。我们提供的数据更加客观。”
罗德继续说道:“对于FM而言,他们的数据并非实时数据。他们每个联赛都有专门的小组自行决定球员们的数值。而我们则利用人工智能‘观看’全世界范围内的足球录像,可以翻来覆去地看上1000遍也不累——换句话说,我们的算法能识别球场上的每一个状况,产生相对客观公正的数据以供计算。”
“查找相似的人”在高级别联赛也得到了应用。比如阿森纳就是用了坎特的模板从桑普多利亚签来的托雷拉。
2012年12月,阿森纳花费210万英镑从美国的数据公司StatDNA购买了数据库,建立起了内部数学统计系统。比尔曼在书中写到:“这笔交易高度保密,甚至于俱乐部的年度账目中都没有提到公司的名字。这笔开支仅以缩写形式记录下来:AOH-USA LLC。”
很快,在俱乐部“足球运营部门”正式任职的亨里克-阿姆斯塔特(Hendrik Almstadt)声名鹊起。毕业于伦敦经济学院的他曾在戈德曼-萨克斯投行(Goldman Sachs)工作三年,又从哈佛商学院取得了MBA证书。他告诉时任俱乐部CEO加齐迪斯要“把球队看成30支不同价位的资产组成的一个投资组合”。阿姆斯塔特的工作是更加有效地利用转会资金和工资预算。他通过StatDNA模拟出阿森纳如早早使用此系统,便不会在沙马赫和朴主永身上白白浪费大把银子。比尔曼写道:“数据显示沙马赫在波尔多的进球效率低于预期,主要是因为他总是在不合理的位置就起脚射门。同时数据还指出沙马赫技术上的严重短板使得他在大开大合的比赛中无法对球队做出足够的贡献。” 温格最终被说服,同意俱乐部购买StatDNA的服务。
可以预见的是,越来越多的顶级联赛的俱乐部可能会加入开发自己的“数字球探工具”中。罗德解释道:“有的俱乐部尝试自己开发一套系统。当然,如果你有自己的算法,那肯定更能满足自己的需求。我们可以刻画出一个典型的左后卫的‘框架’,但莱比锡红牛却对适合自己的左后卫有着清晰的认识。那些超级豪门也可能会拒绝我们,毕竟能入他们法眼的球员少之又少,那么用眼睛也够了。我曾在马德里向尤文图斯推销这套系统。虽然他们仍然热情接待了我们,但仍然对系统的必要性持保留意见。毕竟像这样大的俱乐部,买成品球员总是一贯政策。”
如今,俱乐部似乎都在将直觉和洞察有机结合。布劳沃说:“大数据已经证明它自身就是一个省钱的妙招。没错,事实上过去计算机学家可能也认为我们这群玩数据的和他们是水火不容的。显然这不是一个双赢的想法。如今,一个成功且美妙的项目一定是多人合作进行创造,而不是闭门造车,那样就算你的东西再好,也没人使用。毕竟,足球不能只靠直觉或者单靠数据。”
斯蒂勒则保持了比较谨慎的态度:“目前的转会中,并不是每一笔都是在数据的强力支撑下达成的。有趣的是,在会议上,总有人会站起来说数据分析中最重要的是交流。他总会说分析师需要和俱乐部内诸如体育主管,主教练或者CEO这样的‘足球从业人员’交流。但从来没有人提出‘足球从业人员需要了解数据分析并尽快掌握相关知识’。目前而言,人还是比数据更重要。”
然而,现实中的足球世界往往是那些与足球运动员和教练一起工作的人要“屈尊”适应他们的各种脑洞。视频分析人员的工作是将数据科学家的数学报告转换为球队上下都能听得懂的语言。
史蒂文斯解释道:“球员表现分析专员必须像条变色龙一样灵活应对各种情况。我们不过是足球行业的‘打工者’,我们所做的一切都是为时任主教练服务。不管水晶宫的主教练是阿勒代斯,是弗兰克-德波尔还是霍奇森,我们本身不会变,做的事情要变。
“我们主要制作的是可视化教具——我们的目标是把所有必需的信息整理成册呈现给主教练。有时候主教练要我们写一份80页的报告,我就会问:‘啥?您真会读那么多?’ 我们确实会做一些书面工作,毕竟这是我们的尽责调查。然而我们呈现给主教练的赛前准备报告加上封面页一共也就13页:包括对手的首发预测,队伍信息;把对手在控球和无球权期间的各种战术安排记录成一页,把定位球战术变成一页,实时战术调整记录(比如一球落后的时候是‘都给老子往上冲’还是‘稳一稳,别着急’),以及每个球员的简介,诸如此类。”
拿霍奇森来举例,史蒂文斯的团队的中心会放在为球员量身订造一套“战术手册”。史蒂文斯继续说道:“霍奇森很擅长在我们描述‘对手在控球时会这么这么做’时,说‘很好,但我们需要知道要那样那样做’,如果你不能给出方案那就没有意义。类似地,你很容易看出对方的不足,但如何利用对方的不足又是一门学问——当对方门将持球的时候,我们如何组织防守阵型?如果我们排出了4-3-3阵型,那么我们是不断压迫对方的1/3区域,还是我们快速退守到自己的半场?他们有一个拖后中场,我们是让9号位球员去偷袭,还是让8号位球员上去压迫?我们需要给出具体建议。”
如果说主教练对此尚容易接受,那么球员们对日趋重要的分析报告又怎么看呢?埃梅里执教阿森纳期间,鲜有球员喜欢埃梅里细致入微的视频分析课;而范加尔执教曼联期间,球员们经常抱怨范加尔在冗长的总结会上猛烈吹风,使得他们经常畏首畏尾,到后来,有些球员甚至看都不看范加尔发来的邮件总结就直接删掉。范加尔不得不引入一个插件来观察球员是否阅读了邮件,结果上有政策下有对策,球员们打开邮件的同时也打开了计时器,然后把手机丢掉一边去干其他事了。显然,针对球员应用任何分析方法都要建立在良好的人员管理技巧基础上。某些英俱乐部使用了一个名为Pushfor的应用程序(该应用程序主要在法律界使用),其中包含一项功能可以告诉发件人,收件人(在这种情况下,是球员)是否阅读了每一页报告。阿勒代斯还鼓励他的研究团队把素材发给球员。这些视频素材对视频研究专员而言也许能提起兴致,但球员们提出各自的意见时,这样的情形可能会让球队陷入尴尬。
史蒂文斯说:“你肯定不希望球员们懒洋洋地坐在那边,随声附和着‘嗯,啊,哦’。你希望他们说出‘我觉得那样不行’,‘我不太明白’,或者‘我那么做会怎么样?’ 你不希望面对的是一群行尸走肉。而当他们再回来找你时,就是给分析师出难题了——毕竟这时候你也不希望说话太伤人。”
“现在我们使用的是Hudl这个平台——所有在线视频都可以通过球员们的手机观看,从赛前到赛后,俱乐部自己制作的剪辑视频,潜在对手的视频,门将动作,定位球战术,点球战术,等等。我们还能记录球员们看了什么,看了多久。但我仍然认为你无法对球员们进行填鸭式教学。你应该清楚哪些球员更加渴望学习,哪些球员给他灌多一点就容易短路。有的球员并不适合在圆桌会议上吸取知识,所以你最好给他们开小灶,甚至一对一地谈话。对症下药才能让所有球员的表现都得到提升。”
随着俱乐部围绕最具创新性的分析师和科学家展开争夺,许多致力于大数据分析的年度会议都将重点放在下一个潜在“奇点”上。
数据“跟踪”是数据分析界的流行词之一,它指的是针对球员在场上的移动状况和无球跑动情况的跟踪和记录。Opta,Statsbomb和Wyscout等平台在球员有球状态下的数据采集方面表现出色。这就是所谓的“事件”数据——与球相关的事件。
数据跟踪成为了球员运动轨迹研究的最后一块拼图,不过它仍然没有对球员对场上情况作出反应的原因和后果作出详细解释。
拿切尔西的若日尼奥作为一个具体的例子来说吧。我们可以精确地知道他每场比赛的成功传球数量和传出威胁球的数量,也可以知道他的跑动距离,根据队友的数据测算出他冲刺了多少次。然而我们很难创造出一个数学模型来实时显示若日尼奥带球时是否错过了一次绝佳的传球机会。或者,有一名球员在面对使用高压逼抢战术的球队时,通过数次手术刀般的传球穿透了对手的防线,使得球队能够推进到对方腹地——然而我们的数学模型还无法辨别这样的传球和普通的长传的区别——相比于喜欢高压逼抢的球队而言,喜欢收缩防守的球队让对手送出看似舒服却效果不佳的长传可容易多了。
所以,数据分析师们的挑战是将“事件”数据和通过数据跟踪采集到的数据进行结合,使得主教练们能够更好地做出战术安排,或者决定潜在的签约对象。
巴努布说道:“新的浪潮即将到来——数据跟踪技术使得我们能加上新的‘过滤条件’筛选球员:决定,持球倾向,球员决策的机会成本,等等。球员的勇敢倾向会从利弊两方面分析写入报告,这也将成为主流。当‘事件’数据和数据跟踪采集结合到一起,我们将看到全新的足球世界。”
这个赛季,英超联赛已经为各家俱乐部提供了这方面的数据,但仍然不甚完善,遑论其他欧洲联赛了。行业内认为利物浦正在研发自己的算法,阿森纳也在通过StatDNA制作自己的模型。
同时,两大数据源的集合也更好地反映出后卫的价值。直到最近,我们还能听到人们对后卫在一场比赛中做出了多次的铲断而称赞有加,但更多的职业球员则对此不以为然。比尔曼的书中收录了哈维-阿隆索的一段话:
“当我必须做出铲球动作的时候,是因为我之前犯下了错,” 阿隆索说,“在利物浦的时候,我总会收看比赛日节目,也会看到青年队的一名球员的访谈节目。记者会问他们的年龄,偶像和小球员的长处,小球员会回复诸如‘射门’或者‘抢断’之类的。我很不理解他们接受的足球教育中会把抢断当成一种技术,还会教授抢断的技巧,并将此奉为圭臬,将此标志为球员的风格。这样一来,怎么可能正确阅读比赛?抢断应该是你不得已而为之的选择,虽然你需要用到这项技能,但你不能抬高它的价值。”
史蒂文斯解释道:“防守并不在于‘为’,而在于‘不为’。老派的防守指导就像‘不要倒地铲球,站直了,尝试断球’。然而只要我的位置站对了,那就意味着对手无法传球给他们的前锋,你把所有的路线都封死了。这样一来,防守就不再是球队战术重心的一部分,也不会有‘漂亮的防守’这样的评价——合适的站位本身就起到了防守的作用。而这也是我们引入数据跟踪的原因之一。”
许多公司也努力将自己的产品推广到足球以外的广大市场。Sportlogiq似乎是最接近于普遍化应用的例子,然而我们已经发现众多“李鬼”也悄然现身,打着名不副实的大旗招摇撞骗。TheAthletic披露有一家俱乐部花费了数十万美金给一家他们搜索到的“数据公司”购买球员表现数据,然而在实际应用中却发现这个数据库错误百出,完全没有使用价值。
Analytics FC提供了一种针对后卫研究问题的解决方案,虽然该方案仍待完善,但已经可用。斯蒂勒说:“我们的模型可以使用跟踪数据对后卫进行研究,但还不能把90个联赛的球员一起同时研究。从球探的角度来看,我们把算法提供给俱乐部,是为了拓展球队的‘视野’,补全各路信息,目前我们还在努力。当我们可以在更多联赛中以更方便的方式获得跟踪数据时,我们可以将所有跟踪数据整合起来。我们的算法确实在一定程度上可以评估防守的各个要素,而99.9%的模型却没有。从这个意义上讲,我们‘颠覆’了传统模型。在所有防守情形下,当你计算出从位置X得分的即时概率时,如果防守球员在该情况下做出了封堵,那么球队丢球的风险系数或者概率将和该封堵行为高度相关。如果防守球员在丢球高风险区域进行铲抢或拦截,这些行为会在指标中显示。当然我们不是去统计铲断数量,而是对手此时的得分可能性以及防守球员是如何阻止对手得分的。 ”
当数学家和经济学家还在为其在足球界的地位“争斗”时,业界已经开始意识到俱乐部已经开始愿意为数据科学埋单。然而在新冠疫情已经严重威胁数据平台的财务收支平衡的情况下,有些俱乐部已经开始拖延付款,并且给球员招聘部门的工作人员放了长假。
布劳沃说道:“上周我们和三家俱乐部签订了合同,但另有三家拒绝支付服务费。现在所有球队都没有比赛,我们也没有了研究比赛对手的任务,收入自然会下降。包括欧冠在内的所有比赛停摆对像我们这样的公司而言确实是个打击。到欧洲杯期间,所有数据公司都会研发出自己的数学模型——尽管我不会透露更多细节,但我们‘东方不亮西方亮’,还能从国家队这边获得足够的收入。”
不过数据科学家的收入前景是乐观的。尽管一些顶级俱乐部仍然只愿支付3万英镑左右的薪水给他们,但投行和四大审计公司正在迅速拔高收入水平线。斯蒂勒说:“现在,大多数俱乐部都在招募数据科学家,这样的情况与15年前的体育科学革命非常相似。当时,从拉夫堡大学或巴斯大学体育科学专业毕业的学生往往收入很低。他们会进入一家俱乐部,只做一些体育训练和球场维护之类的事情,而被教练完全忽略。人们会说,‘反正他做的事人畜无害,就让他干着吧。’
“如今,每家俱乐部都设立了体育科学部门,拥有10名左右的专业人员协助球队工作,甚至还有专门负责为球员装备GPS系统采集数据研究结果的。这可是天翻地覆的变化,所以我相信数据科学将改变足球,改变人们的观念。大多数俱乐部已经有一名视频分析师,许多俱乐部也聘请了一名数据专家:不过其中许多人并没有什么数据科学背景:他们不是数学家,经济学家或科学家。但是,顶级俱乐部现在需要物理学家,计算机工程师和数据工程师。而留住高水平的人要花钱,因为他们找一份高薪银行工作易如反掌。看看哈佛大学核物理学家、却在利物浦工作的斯皮尔曼吧,有多少人能达到他那个地位?所以他想要什么,就能有什么。”
我们能否看到俱乐部与一流大学合作,并让数据科学家指导研究生计划?斯蒂勒:“确实有可能。在其他体育项目中,各项目都在各自竞争。而在足球行业,高级数据建模公司,政府,四大审计都在抢数据科学家。有一件事永远存在:在俱乐部工作可以给他们发稍低一些的工资,只因为这是足球。人们总是更喜欢有参与感的事情。”
芬克尔斯坦认为他17年前的大胆预测如今已成为现实。他总结道:“我最近和利物浦的伊恩谈了谈,他十分确信与亨利在Fink Tank的合作对足球分析的发展至关重要。我非常感谢他的这番话!”