三天后,2018年俄罗斯世界杯即将拉开帷幕。 第一场比赛将于6月14日在东道主俄罗斯队和沙特阿拉伯队之间展开。
每届世界杯最受关注的部分就是决赛。 2014年上届世界杯,东道主巴西队意外未能夺冠,仅获得第四名,无缘决赛。 今年,不少机构/研究人员预测德国将与巴西争夺冠军,巴西获胜的机会更大。
根据各种预测和民意调查,冠军几乎肯定会在巴西、德国和阿根廷之间。 激烈的竞争虽然让人赏心悦目,但似乎缺乏一些惊喜。
机器学习和大数据方法越来越多地被用来预测比赛结果,不仅在世界杯上,而且在球队组成、战术选择和球员训练中。 对于球迷和观众来说,人工智能也将开启参与/观看体育赛事的新体验。
机器学习预测:巴西夺冠
肯尼亚成吉思汗资本投资银行投资银行分析师Gerald Muriuki最近在Medium上发表了他利用机器学习对FIFA 2018结果的预测——巴西将夺冠。
这一结果与微软人工智能和数据科学专家 Sorin Peste 的预测一致。
事实上,预测世界杯冠军是一个典型的机器学习问题。 你首先预测每场比赛的获胜者,然后预测小组赛、半决赛和决赛的冠军。 在此过程中,您需要集成数据、模型特征并预测结果。 因此,很多机器学习或者数据科学家都做了类似的项目。
Muriuki 和 Peste 都根据足球比赛的历史数据构建了机器学习模型,模拟了比赛,并预测了这些比赛的结果。 让我们逐一看一下。
使用逻辑回归进行预测
Muriuki 使用了 Kaggle 的两个数据集,包含 1872 年至 2017 年国际足球比赛的结果。他首先分析了这两个数据集,做了一些特征工程,选择了与 2018 年世界杯最相关的特征进行预测,然后进行了一些数据增强。
在模型选择方面,Muriuki 使用了逻辑回归,一种分类器算法。 逻辑回归通过使用逻辑函数估计概率来衡量分类因变量与一个或多个自变量之间的关系。 简单来说,给定一组相关数据,逻辑回归可以预测结果(以世界杯为例,就是预测输赢)。
这是他的模型对前几场比赛的预测结果:俄罗斯对阵沙特阿拉伯,俄罗斯获胜; 乌拉圭VS埃及,乌拉圭胜; 伊朗对阵摩洛哥,平局。 四天后,你就可以验证这个结果是对是错。
16强赛结果如下:
四分之一决赛将在葡萄牙与巴西、德国与阿根廷之间进行。
最终,巴西对阵德国,巴西获胜。
使用随机森林进行预测
另一方面,微软人工智能和数据科学专家Sorin Peste的预测过程则更加完整。 在数据选取方面,除了历届世界杯的成绩外,佩斯特还使用了欧洲杯、奥运会等重大赛事的数据,以及这些赛事的胜率分布。
此外,佩斯特还考虑了比赛的地点,即是主场、客场还是双方都没有任何关系的中立场地,以及比赛是否“友好”。 进行友谊赛时,目的不是为了获胜,而是观察对方的球员和策略。
对于模型选择,Peste 使用随机森林(深度 500),该算法根据提供给它的特征生成多个决策树,并且每棵树对每个新输入向量的结果进行“投票”。 随机森林速度快、相当准确,并且可以提供泛化误差的无偏估计,因此不需要交叉验证。
下图显示了1000次迭代后的结果,巴西获胜,阿根廷第二。
统计方式:德国险胜巴西
当然,除了机器学习之外,还有更多利用大数据方法的预测。 KDnuggets上的一位狂热球迷使用统计方法预测德国队将赢得冠军。 他的步骤如下:
收集信息:
FIFA世界排名:这是所有211支国家足球队的排名系统。 采用积分制度,积分基于所有国际足联认可的国际比赛的结果。 然而,这不是最好的系统并且有很多缺点。
Elo评级:该系统最初是为国际象棋联合会FIDE开发的,用于对国际象棋棋手进行评级。 其复杂的矩阵根据比赛类型分配分数,并考虑双方之间的进球差异。 它与FIFA的主要区别在于它还统计友谊赛的场次。
TransferMarkt 球队价值:这家位于德国的网站提供足球各个方面的信息,包括每位知名球员的估计市场价值。 他们列出了参赛国家及其团队价值观。
投注赔率:使用投注比较网站 OddsChecker 获取每个国家/地区最丰厚的赔率。
TransferMarkt 的数据以欧元为单位,而 FIFA 和 Elo 有自己的评级系统,投注赔率以点数为单位。 作者对每个系统进行了标准化,以使它们具有可比性。 在统计学中,标准分数(也称为 z 分数/值、正常分数或标准化值)是值与平均值不同的标准差数。
2018世界杯,四大热门预测源
KDnuggets 预测的 z 分数
如果KDnuggets的预测正确,世界杯小组赛结果将如下:
研究结果得出了一些有趣的结论:
民意调查:德国、巴西、阿根廷最受欢迎
除了KDnuggets的预测之外,世界杯之前还有很多其他的预测:
《每日电讯报》对每支球队进行了广泛的分析,最后进行了一项民意调查,让读者预测获胜者。 结果如下:
此外,据中新社报道,俄罗斯彼尔姆国立研究大学学生维克托·扎科帕洛建立了一个可以预测2018年世界杯冠军的神经网络。 经过对各种参数的分析和计算,神经网络得出世界杯前三名的球队将是德国、巴西和阿根廷。
四年前,巴西主场1:7不敌德国,创下自1920年0:6不敌乌拉圭以来世界杯最大失利纪录,震惊全国。 最终,德国夺得了当年的世界杯冠军。
许多组织预测,巴西队和德国队将争夺今年俄罗斯世界杯的冠军。 巴西能否复仇,德国能否成功卫冕? 我们必须拭目以待。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请联系本站,一经查实,本站将立刻删除。如若转载,请注明出处:https://mdxbjj.com/html/tiyuwenda/5195.html