2016欧洲杯将从6月10日到7月10日在法国举行,此届比赛也是欧足联决定将参赛名额由16队扩充至24队之后的首届欧洲杯。为了预测各队夺冠的概率,我们的预测模型综合了19家网络*彩博**公司的*率赔**数据。最热门的球队是东道主法国队21.5%,其次就是世界杯冠军德国队20.1%,再次就是卫冕欧洲杯冠军西班牙队13.7%,与前两队有不小的差距。其他的就更低了,英国9.2%和比利时7.7%的概率是其他球队里面最高的。
我们还进一步模拟了整个杯赛,预测了两两之间获胜的概率,以及晋级下一轮的概率。比如,头两号热门法国队和德国队在半决赛相遇的概率是7.8%,决赛相遇的概率是4.2%,这相当于是2015年11月13日巴黎恐袭案时重赛,当时法国2:0轻取德国。决赛很可能是这两队之间的胜者同西班牙队。法国和西班牙进入决赛的概率是5.7%,德国和西班牙进入决赛的概率是5.4%。
所有的预测基于19家*彩博**公司给2016欧洲杯各队所开的*率赔**:这是首次使用抽水调整后的*率赔**和平均对数*率赔**,然后再转化成赢球概率。并且,通过杯赛模拟的反向程序,我们模拟了球队能力值,然后再估算出杯赛各阶段两两球队之间概率。
这种模拟方法曾经成功预测了2010年世界杯冠军和2012年欧洲杯冠军,2008年预测对了决赛球队,2014年世界杯预测对了四强中的三强。
*彩博**公司一致性
为了更好的预测2016欧洲杯冠军,我们从19家网络*彩博**公司采集了*率赔**(见表1)。因为这*率赔**是*彩博**公司抽水后的概率,所以并没有反应真实的赢球概率,所以必须先去掉抽水。
假设抽水后的*率赔**=真实*率赔***δ+1,1是本金,δ是*彩博**公司实际的赔付比例,抽水就是1-δ。为了统计的方便,我们假定每一家*彩博**公司对不同球队的抽水是一致的,根据*率赔**可以计算出19家公司的平均抽水值是15.1%。

表1:18家网络*彩博**公司各队的夺冠*率赔**
根据*彩博**公司一致性模型,法国是最有可能东道主夺冠的(21.5%),其次就是世界杯冠军德国队(20.1%),超过10%概率的还有卫冕欧洲杯冠军西班牙(13.7%)。后面就是英国(9.2%)和比利时(7.7%),这两支球队在资格赛和最近的友谊赛里都展现出这种实力。
尽管预测夺冠概率可能是最有意思的,但是我们还要继续用*彩博**公司的*率赔**来推断各队间的相对实力以及杯赛可能的过程。杯赛模拟基于下列想法:
-
如果能够得到球队的能力值,那么每一场可能比赛的两两球队之间的赢球概率是可以计算的。
-
给定两两球队之间的赢球概率,那么整个杯赛的就很容易被模拟,也就能知道哪个队会进到哪个阶段以及谁能夺冠。
-
这种杯赛的模拟次数可以充分运算得到各队夺冠的次数(本文运算了10万次)。
我们来使用2010年雷特纳提出的迭代方法来计算球队能力值,10万次迭代计算后的夺冠概率和*彩博**公司一致性概率非常接近。这样一来,我们可以不计平局带来的影响,具体的对数能力值见表2。

图1.基于*彩博**公司一致性模型的2016年欧洲杯各队夺冠概率

表2: 2016年欧洲杯的*彩博**公司一致性模型,来源于19家网络*彩博**公司的*率赔**数据。列出了每队一致性夺冠概率(用%表示),对应的对数*率赔**,模拟的对数能力,以及所在的小组。
两两比较
用于模拟夺冠概率的两两之间比较的经典方法是布拉德利和特里1952年提出来的,同2008年Elo的评定法类似。布拉德利-特里方法是用球队相应的能力来计算球队A击败球队B的概率,用下式表示:
Pr(球队A击败B的概率)=球队A的能力值/(球队A的能力值+球队B的能力值)。

图2. 所有2016欧洲杯球队两两之间赢球的概率。用颜色表明了概率的大小,灰颜色的格子都是概率接近的(40%到60%之间)。
正如我们在第一部分解释的那样,球队的能力值已在表1里显示了,因此两两之间的赢球概率布拉德利-特里公式就可以计算,最后计算出来的夺冠概率同*彩博**公司一致性夺冠概率非常接近。图2就是用表1的能力值计算出来的结果,用可视化的表格来显示。
很明显,*彩博**公司认为这届杯赛里法国和德国是最强的两队(法国击败德国的概率是50.5%),他们击败其他各队的概率基本都在70%以上。比较高概率的能击败法国和德国两队的也就西班牙(击败法国和德国的概率分别为43.7%和44.2%)、英国(38.7%和39.1%)和比利时(37.4%和37.9%)。很有意思的事,球队能力值非常弱的两队(罗马尼亚和阿尔巴尼亚)跟法国同在A组。
杯赛过程中的表现
根据第二部分中的球队能力值和对应的概率数据,我们对整个杯赛模拟了10万次。正如上面解释的一样,最后模拟的结果同*彩博**公司一致性夺冠概率基本一致。所以对于夺冠概率,没有什么新的发现的,但是模拟结果也显示了每个队晋级各个阶段的概率。
图3描述了根据分组所有24支球队晋级各个阶段的“存活”曲线。法国和德国很明显在各自的A组和C组中几乎都能100%概率能晋级16强,再晋级8强的概率也没降低多少。

A组和C组其他各队晋级就都有点困难了。B组英格兰优势明显。而D组和E组各有一个热门球队西班牙和比利时,但是都各有一个强劲的竞争对手(克罗地亚和意大利)。F组较弱,但相比于前面各组实力更平均。

表3:2016年欧洲杯各队进入各阶段的“存货模拟概率”
根据新的欧洲杯赛制,24支球队会有16支晋级下一轮,所以即使最弱的球队,也会有40%的概率晋级。从“存活”曲线上也可以明显看出,这些弱队基本没什么机会进到半决赛的了。
为了突出分组不均,图4用小组里除去最强队后其他三队的相对平均对数能力值来显示各组,中间的线是所有各队的平均值。可以很明显的看出法国和德国所在的A组和C组很弱,而D组和E组很强。
图3. 2016欧洲杯各队进到16强、1/4决赛、半决赛、决赛和夺冠的“存活”概率
总结
对2016欧洲杯的预测是基于我们以前研究工作的基础上,曾准确预测了2010年世界杯冠军和2012年欧洲杯冠军,2008年预测对了决赛球队,2014年世界杯预测对了四强中的三强。核心的是跟雷特纳等人2010年发表的文章里所阐述的相同:使用国际*彩博**公司的专家知识。
因为*彩博**公司已经充分考虑到了各种风险,不然的话,开出一个没有水平的*率赔**会使*彩博**公司损失一大笔钱的。所以,我们的预测完全基于19家网络*彩博**公司的专家。具体的来说:1. 调整*率赔**,除去了*彩博**公司的抽水。2. 综合这些数据,然后平均得到一致性评定。3. 使用经典的两两对比模型得到平局调整后的球队能力值。
一点也不奇怪,我们的预测同其他机构的预测结果非常相关,尤其是国际足联和Elo评定。一致性对数能力值同国际足联和Elo评定的斯皮尔曼等级相关系数分别为0.653和0.896。
但是,我们的一致性模型还可以发现各种进一步的结果,比如“生存”曲线就可以看到各队晋级各阶段的概率。当用散点图来表示一致性对数能力值和Elo评定数据时,会发现有一些队很明显的在更好或更差(在那条最小二乘回归曲线的上方或下方,比如威尔斯明显高于直线,葡萄牙和乌克兰明显低于直线。意思就是一致性模型和Elo评定是有差异的)。

图4.24支球队的*彩博**公司的一致性对数能力值和Elo评定之间的散点图,中间是两者的最小二乘回归线。
毋庸置疑,这些所有的预测只是基于概率的,概率是可能发生而不是必然发生。在*彩博**公司专家的眼里,法国是最有可能利用东道主身份夺冠的,但是也很有可能其他球队会夺冠。这是我们建议你不要根据我们的分析来下注的原因之一。还有个更重要的原因是,你应该清醒的认识到,*彩博**公司已经有15.1%的抽水在那了,怎么玩你都是输的。我们自己不会投注,只会享受欧洲杯、享受预测的快感。
大数据
享受比赛预测快感!
什么?享受欧洲杯、享受预测的快感,好像与球商的理念不谋而合。是的,在球商这里,预测比赛看大数据,同样独家的基本面也是欧洲杯预测之美的关键。大数据、欧洲杯,球商都一网打尽,你还在等什么?
全免费的爆料尽在球商APP,登录www.ballq.cn *载下**球商APP。
球商作家突破1000人,大小联赛全网罗。