近年来,数据和统计数据在足球中变得越来越普遍。最前沿的是预期目标(或 xG)。自 2012 年 Opta推出 xG 以来,该指标已成为足球分析中最广泛和最有见地的指标之一。

XG在经过足彩公司和球员转会市场早期采用之后,预期进球现已成为天空体育和每日比赛等主流广播公司的常规功能。xG已经从分析师的笔记本电脑上升,现在经常出现在英超联赛经理的嘴里。
利物浦的尤尔根·克洛普(Jurgen Klopp)最近将他们的预期进球输出与曼城进行了比较,而阿斯顿维拉的迪恩·史密斯(Dean Smith)在本赛季的采访中经常使用该指标来讨论球队的基本表现。 那么本文将告诉您什么是XG,学会XG的运用会为我们带来哪些好处!

什么是预期进球 (xG)?
预期进球(或xG)通过计算在特定比赛阶段从球场上的特定位置得分的可能性来衡量球员把握机会的能力。
怎样理解特定比赛阶段?比如,昨晚的比赛巴黎圣日尔曼VS洛里昂,姆巴佩的个人XG是0.63,但当队友阿什拉夫被红牌罚下后,他的个人XG还是0.63吗?显然不是,因为XG是基于射门位置、将会出现的机会数量以及将获得各种射门机会类型再综合球员的能力计算得出。当队友被红牌罚下后,全队每个人的数值都已经大幅度下降,输球是大概率事件。

姆巴佩目前个人数据
xG 以 0 到 1 之间的等级进行测量,其中 0 表示不可能得分的机会,1 表示球员每次都有望得分的机会,也就是说当球员XG越接近1,球员的得分能力越强。

哈兰德目前个人数据
通过上图你可以看到,曼城队的哈兰德目前无点球XG是0.79,打败了这个星球99%的前锋。
怎样理解特定位置得分?在观看比赛时,球迷可以直观地判断哪些机会有可能得分,但数据分析时,只能从射手距离球门的远近、射门的角度、是否一对一、是否绝佳机会、用哪个身体部位射门?射门前的传球类型(例如,传球、传中、倒三角等),射门前的比赛运行模式(例如,开球、快速突破、直接任意球、角球、掷球等)等等具体的射门辅助数据去分析和计算球员的得分能力,举个例子:

让我们比较一下他们2019-20赛季的两名球员,英超联赛的曼城的加布里埃尔·热苏斯和意甲的AC米兰的哈坎·恰尔汉奥卢。这两名球员上赛季都完成了100次射门(不包括点球),但分别打进了14个和8个进球。那么,他们的射门有什么区别呢?

热苏斯百次射门点位图
尽管恰尔汉奥卢实际表现大于预异(8,XG7),热苏斯的表现略低于预期(14,XG17.7),但他们的100次机会在质量上却大不相同,他们的射门反映了这一点。热苏斯的得分和射门位置大多在禁区内,XG0.18,每6脚射门就会带来一粒进球,而恰尔汉奥卢射门多来源于远射,这就导致恰尔汉奥卢每次射门的xG要低得多(0.07)。

我们可以通过查看他们每次射门的点位来分析球员的射门质量,图中紫色的点表示未进球射门,红的点代表进球射门。
点的大小表示得分的可能性,而创造在这些点射门的机会是由球队、球员、教练战术和对手能力共同决定的,让不同的球员去打热苏斯的位置得到的结果肯定不同;同样,让热苏斯换一支球队,他得到的射门机会也会不同。所以,综合场上阵容球员的整体XG、球队状态、射正次数、失球预期所得出的 全队预期进球 ,可以从某个角度反映一场比赛的双方的实力对比。
为什么预期进球在当今的足球中很重要?

运气和随机性比任何其他运动更频繁地影响足球的结果。我们经常看到某支球队统治着比赛,但在最后一刻被打进绝杀球而输掉比赛。但这显然不是常态,xG 允许我们通过评估机会质量而不是实际结果来评估比赛结果或球员或球队表现的过程。

举个例子:2015/16赛季的尤文图斯。那一个赛季,尤文图斯在前10场比赛中只赢了3场,但他们的实际进球远远低于球队的xG。这意味着他们有机会,但并没有转换他们,这表明如果他们只是在门前更幸运一点,他们将迎来更为积极的结果;果然,在12轮比赛之后,他们的运气发生了变化,实际进球能力又开始远远高于预期,赛季综合表现趋近于球队XG,最终赢得了那个赛季的联赛冠军。就如同一个人掷了5次硬币都是正面,但是您如果再抛10次、20次、100次,正反面出现的结果会越来越趋近于50%。

xG 为我们提供了一种更准确的方法来预测比赛结果,而不是简单地使用单个统计数据。在英超联赛中,如果我们只看射门次数,那么,射门次数最多的球队只有71.6%的几率赢得锦标,但用XG得分总数来衡量,在全英超获得更高xG得分的球队有更高的几率(81%)赢得锦标。
由此,我们可以知道全队预期进球和个人预期进球就相当于是抛硬币种的那个50%概率参照线,您可以从XG去判断每支球队哪些球员的竞技状态不好,不好到那种程度,他们的糟糕状态是否会影响球队。 比如昨晚我们预计如果没有出现改变比赛进程的事件(红牌、大雨、个人严重失误)出现的话,国米将会是毫无疑问的获胜方。因为我们查看了之前双方的比赛数据,也参照了拉齐奥客战尤文,国米主场迎战尤文的2场比赛数据

XG之比1.1:1.5

国米客场对阵拉齐奥,各种数据都领先于拉齐奥,唯独门将数据大大落后,特别是扑救率上面,国米老门将汉达诺维奇57.1%被对方门将普罗维德尔85.7%秒成渣。

而国米目前主力门将奥纳纳的数据全面领先汉达,其中预期失球两者相比奥纳纳下降了61%,0.9:1.45。所以我们都一致认为国米将会获胜。

虽然比赛过程中阿切尔比的个人重大失误差点改变的赛果,但在其他数据以及全队XG大大支持国米的情况下,以目前国米全队的状态,国米扳平或反超都是偶然中的必然(当然也不排除有些数据支撑不够的球队逆风球能力不足,在数据有优势的情况下没有能力扳平或反超,比如前晚葡超的维泽拉VS费雷拉。
参照数据:

XG之比1.6:0.4


意大利杯次回合国米主场 XG1.25:0.54


联赛次回合国米主场,XG1.2:0.6

当使用预期进球来查看哪些球员的命中目标比数字所暗示的要多或少时,如果他们的进球数始终多于他们获得的机会质量,有智慧的球探可以据此数据,前往侦察,看看是否有机会为球队带来一名拥有光明未来的多产射手。

另一方面,如果一名球员在几场比赛中超过了他的预期进球,但过去没有这样做的历史,这可能归结为他的状态和运气或者教练的战术倾向,而不是进球天赋,他可能很难在很长一段时间内或别的球队保持这种状态,

从另一个角度来说即使这名球员因伤缺战,也不会为球队带来多大的影响,其他拥有相同XG的球员完全有能力顶上,由此你可以判断菠菜公司的诡异指数变动是否对比赛有实质性的影响,从容的选择顺向选还是反选,这是非常多亚盘大神和欧赔经验帝致命的缺陷 。
XG的局限性
1、xG只是衡量机会质量,通过机会质量和比赛场次统计的场均合并平均值可以反馈比赛中两队的实力对比,但不是比赛的预期结果。
2、在比赛中拥有较高 xG 的球队并不一定意味着他们一定能赢得比赛,但绝对意味着他们的实力更强。一张红牌、一场大雨、点球、拥有任意球大师、完美的定位球战术、一个无中生有的神仙球打破比赛均衡、一个错判漏判造成的球员心态失衡、高XG球员重伤下场等都会为比赛带来决定性的影响。

3、XG不能用于泊松分布去计算比赛结果,我们试过了,准确率不到15%,可能是我们的模型有问题欢迎更多朋友探讨。
4、xG 模型还受到一些暂不能被收集的其他因素制约,例如射门力量、射门时的弧度或飘旋,或者守门员扑救时是否看不见球的方向或失去平衡等,所以在这方面有优势的球员,常常XG被低估。
5、无法预测进球数,只能解释某一场比赛中的比分是多么的不可能。正如该模型的创建者山姆·格林(Sam Green)所说:“像这样的系统也无法预测高进球率的比赛,因为XG是基于平均值计算的”。比如前晚英超布莱顿VS狼队。