世界杯史上的巅峰决赛对决 (世界杯巅峰决战)

世界杯决赛,既是终局也是高潮,阿根廷队与法国队开启巅峰对决,胜利的一方将第三次获得世界杯冠军,他们球衣的胸口处也将闪耀着三颗星。无论哪一方获胜,这场比赛都必将载入足球比赛的史册,我们也都有幸见证新的历史。

对于全世界的球迷来说,阿根廷登顶最大的意义莫过于诞生又一位真正的“球王”。梅西的足球生涯已经囊括了几乎所有荣誉,此前还保持着七次获得“金球奖”的纪录。然而35岁的他从未获得足球运动中的最高荣誉——大力神杯,这也是他与贝利和迭戈·马拉多纳两位伟大的球王相比所缺少的唯一成就。

对于德尚领导的法国队,他们的梦想是创下连续两次夺得世界杯冠军的历史。在本届杯赛中,谁也挡不住的姆巴佩距离创造纪录只差一步,目前他已有5个进球入账,不仅金靴在向他招手,如果法国卫冕,姆巴佩还有可能成为自贝利以来第一位在24岁生日前两次赢得世界杯的球员。

决赛最令人期待,结果却也最难以预测。 零点有数也来参与一把,以世界杯算法模型进行预测,预测结果是阿根廷队获胜(概率52%)。阿根廷队也与预期一样,最终点杀法国队,夺得了大力神杯。

决赛精彩绝伦,连剧本都不敢这么写。上半场阿根廷队独领风骚,以2比0领先,没想到在下半场,法国队姆巴佩连下两城扳平了比分;到了加时赛,在梅西破门拿下一分后,姆巴佩再进一球完成帽子戏法战平,进入点球大赛;最终,阿根廷队在点球大战中以4比2击败了法国队。梅西终于“封神”圆梦世界杯,姆巴佩则成为史上第二位世界杯决赛戴帽球员,并以8粒进球加冕本届世界杯的金靴奖。

世界杯巅峰决战,世界杯史上十大巅峰对决

图源:零点有数

01

零点预测世界杯赛果,

算法准确率超六成

虽然一直有“足球反着买,别墅靠大海”的戏言,但本届世界杯的爆冷实在是太太太多了,预测结果混合着“玄学”和科学的色彩。前有因猜中8场世界杯比赛结果而名扬四海的章鱼保罗和著名的“乌鸦嘴”球王贝利,后有谷歌、微软、百度、华为等科技公司采用人工智能预测胜负。

零点有数研发世界杯算法模型,也加入了本届世界杯的预测之列。值得一提的是,零点有数的世界杯算法模型叠加了特有的“爆冷BUFF”,让模型准确率进一步提升。 将预测结果与实际情况进行对比验证,零点算法模型对淘汰赛的预测准确率为75.00%(16场中成功预测12场),对小组赛的预测准确率为56.25%(48场中成功预测27场),综合准确率高达62.90%。

世界杯巅峰决战,世界杯史上十大巅峰对决

图源:零点有数

02

模型不断优化,

成功预测“爆冷”平局

1、摩洛哥VS克罗地亚

预测:平局

实际结果:平局(比分0-0)

爆冷指数:★★★★★

摩洛哥队尽管在一众非洲球队中表现抢眼,但与上届亚军、经验老到的克罗地亚队相比还是存在一定的差距。然而,经过零点有数的世界杯算法“掐指一算”,成功预测两队将握手言和,以一场意料之外的平局收场。

在实际比赛中,上半场双方互有攻守,虽有激烈的拼抢,但都无法破门。到了下半场,双方也都进行换人调整,一直在寻觅良机,但最终还是互交白卷,这个结果对于摩洛哥队来说已实属“爆冷”。而且摩洛哥在后续比赛中更是凭借出色表现,淘汰世界排名第2位的比利时队,以小组第一出线。

2、乌拉圭VS韩国

预测:平局

实际结果:平局(比分0-0)

爆冷指数:★★★★★

南美传统劲旅乌拉圭,每届世界杯都有不俗的表现。这一届乌拉圭队镇场老将与年轻血液并存,阵容搭配合理,加上南美特有的华丽脚法,整体实力显然强于韩国队。面对这样一场似乎强弱分明的比赛,零点有数世界杯算法再度出手,成功预测两队将打平,韩国队再次为亚洲球队献上冷门。

比赛开始后,乌拉圭队竟被韩国队强力压制,前15分钟韩国队的控球率一度达到70%,之后两队虽均有争夺,但仍然以0比0战平。后续比赛中,韩国队2比1击败葡萄牙,并最终凭借总进球数优势,力压乌拉圭登上小组第二名,成为本届世界杯第三支晋级淘汰赛的球队。

世界杯巅峰决战,世界杯史上十大巅峰对决

图源:零点有数

03

五步揭开零点世界杯算法的面纱

1、选择基础数据,构建模型框架

涉及足球比赛,特别是世界杯场次的预测非常多,常用的维度比如球队的参赛纪录、胜负记录、教练和球员数据、竞猜*率赔**,甚至点球记录等。 考虑到信息获取的难易度,最终确定选取两项最重要的指标作为测算依据,分别是:历史赛事得分数据, 包括比赛时间、参赛队伍、进球数等数据; FIFA男足世界排名历史数据 ,包括排名、累计积分、发布时间等数据。

2、对数据做预处理

预处理主要分为三步走: 第一步是筛选, 以双方近4年的历史赛事数据作为标尺; 第二步是校验, 将历史赛事得分数据与FIFA世界排名数据做一致性处理; 第三步则是拼接, 对于分析的目标赛事,匹配该场比赛时间之前两支球队的最新FIFA排名。

世界杯巅峰决战,世界杯史上十大巅峰对决

图源:零点有数

3、构造相关复合型指标

对各项数据对于模型的预测能力进行逐一分析。初步构造的变量包括但不限于:

●主客队最新FIFA排名的差值(比如伊朗与美国的差值为4);

●当前比赛日前(比如11月30日),在所有历史比赛日期中,主客队FIFA排名平均值的差异;最近的5场比赛中,主客队FIFA排名平均值之间的差异;

●当前比赛日前,在所有历史比赛中,主客队平均进球数之间的差异;最新的5场比赛中,主客队平均进球数之间的差异;

●当前比赛日前,在所有历史比赛中,主客队平均比赛得分之间的差异;最新的5场比赛中,主客队平均比赛得分之间的差异;

初步构造完成后,根据变量的概率分布特征,对生成的变量进行筛选。 例如,对于获胜或失利的比赛,如果某项变量的概率分布差异明显,则认为该变量对模型具有一定程度的预测能力,反之,则预测能力较弱。经过对各项变量的不断重复计算,最终找出可用于预测比赛结果的变量组合。

世界杯巅峰决战,世界杯史上十大巅峰对决

图源:零点有数

4、选取合适的模型

将选出的变量数据分成训练集和测试集,对每一模型,调整其参数设置,如学习速率、最大深度等,比较不同模型在测试集和训练集上的表现。对于本次世界杯比赛的胜负预测,经反复比较,确定选用 Logistic Regression (逻辑回归)、 Gradient Boosting (梯度提升)、 Random Forest (随机森林)、 LightGBM 等模型进行测试。最终,根据测试表现结果和复杂程度,选择 Logistic Regression (逻辑回归)和 Gradient Boosting (梯度提升)作为主要模型。从本届世界杯开赛以来各场的实际结果来看, Gradient Boosting (梯度提升)模型的预测准度相对更高。

世界杯巅峰决战,世界杯史上十大巅峰对决

图源:零点有数

5、使用最优模型,预测比赛结果

争取世界杯每场比赛的胜利绝非易事,除了球队的硬实力外,球员的伤病、裁判执法的尺度乃至于临门一脚的运气都可能对结果产生意想不到的影响,因此“爆冷”也是世界杯的常客。 所谓“爆冷”一般有两种情况 ,一种是在各项数据上一支球队实力明显不如另一支球队,但是最终的比赛结果却是弱队逼平或赢了强队,比如沙特逆转阿根廷;另一种则是两支球队势均力敌,但最终比分却是“一边倒”,一支球队出现了大比分落败的局面,比如2014年世界杯半决赛巴西队惨败给德国队。考虑到世界杯“冷门”频出,因此在原始预测模型的基础上,增加了一个“爆冷权重”的buff。

“爆冷权重”一方面是计算弱队的“爆冷潜力” ,根据国际足联积分排名、参加世界杯次数以及过往国际比赛胜率等因素,比较参赛双方球队实力,确定相对较弱的球队,计算弱队在国际比赛数据中实现以弱胜强、反败为胜的比例; 另一方面对于强队,主要考虑其发挥的稳定性,计算在过往比赛中的“翻车”比例;此外,还要综合考虑双方球队的出线压力 ,毕竟面对生死战的弱队更有可能超常发挥。对于可能出现“冷门”的赛事,预测时利用该权重调节原模型预测概率实现buff加成,提升准确率。

通过验证, 零点有数世界杯算法对摩洛哥VS克罗地亚、乌拉圭队VS韩国队的两场“意外”平局都实现了精准预测。在淘汰赛阶段,模型也成功预测了荷兰、阿根廷、英格兰和法国等传统强队的晋级。

世界杯巅峰决战,世界杯史上十大巅峰对决

图源:零点有数

预测为观察比赛提供了一个有趣而又神秘的角度,足球比赛总是充满悬念,终场哨声吹响前,一切皆有可能。零点有数运用算法技术优势,试图将人工智能算法带入到足球世界之中,以“解密”的形式与球迷们一同感受预测不确定性带来的魅力,带来科学预测与探索未知的双重的美妙体验。

注:本文绝不构成任何投资建议,零点有数真诚建议各位放平心态、轻松观赛,享受足球纯粹的快乐!

往期预测:

世界杯“亚洲之光”遗憾止步,零点算法早做预判

三狮军团VS卫冕冠军,零点算法再度预测世界杯战果