西甲第22轮还有5场比赛,今天使用随机森林算法预测这5场比赛的半场、全场胜负,最后在附加一张西甲联赛的关联图
数据框中英文缩写的说明:FTR:全场赛果,HTR:半场赛果,HDA:对应赛果的胜平负。
对西甲近三个赛季的数据进行清理(去除缺失的数据),得到完赛场次962场,如下图:

西甲联赛完场数据
录入即将开赛的5场比赛的数据,*率赔**公司选取威廉、立博、B365、Inter4家,如图:

五场比赛的4家*率赔**公司数据
首先预测全场赛果(FTR):设置X_test、Y_test,为了与预测的5场比赛进行对应,完赛的962场比赛同样选取上述4家*率赔**公司,设置如下:
x_test = matche.iloc[:,4:]
y_test = matches['FTR']
设置训练集train(即要预测的5场比赛),导入随机森林分类器,对赛果进行预测,如图:

导入随机森林分类器
输出的结果如下图:

全场赛果的概率分布
修改Y——test对半场赛果进行预测,只需将'FTR'替换为'HTR'

半场赛果的概率分布
最后,生成一张365平赔与半场、全场赛果的关联图,作为投注竞彩的参考,365对于西甲来说还是比较有代表性的

365平赔与半场、全场赛果关联图

365平赔与半场、全场赛果关联图

365平赔与半场、全场赛果关联图
简单说明:以3.00平赔为例:全场赛果(FTR)出现12次(count),胜平负都出现过(unique),出现最多的是D(top),D出现6次(freq)