欧洲足球数据库
欧洲职业足球的25k场比赛,球员和球队属性终极足球数据库,用于数据分析和机器学习
- +25,000场比赛
- +10,000名玩家
- 11个获得冠军的欧洲国家
- 从2008年到2016年
- 玩家和球队的属性*来自EA Sports的FIFA视频游戏系列,包括每周更新
- 队伍与小队队形(X,Y座标)
- 多达10家供应商的赔率
- +10,000场比赛的详细比赛事件(进球类型,控球,角球,传中,犯规,纸牌等)
* 2016年10月16日:包含FIFA球队属性的新表格!
原始数据源:
您可以轻松找到有关足球比赛的数据。
-
http://football-data.mx-api.enetscores.com/:比分,阵容,团队组成和事件
-
http://sofifa.com/:EA Sports FIFA游戏中的球员和球队属性。FIFA系列和EA Sports的所有FIFA资产财产。
在查看数据库时,您会注意到
玩家的外键,并且比赛与原始数据源相同。我
称这些外键为“ api_id”。
改进数据集:
您会注意到阵容中缺少一些球员(NULL值)。这是因为我无法从FIFA中获取其属性。随着爬网算法的改进,这将固定为超时。
该数据集还将扩展到包括国际比赛,国家杯,冠军联赛和欧罗巴联赛。
探索数据:
您可以使用此数据集做很多事情。我将在此概述页面中添加视觉效果和见解,但是请查看内核并自己尝试一下!以下是一些适合您的想法:
圣杯……
显然是在预测比赛的结果。赌徒使用3类(主场赢,平局,客队赢)。他们大约有53%的时间正确。到目前为止,这也是我使用自己的SVM所实现的。尽管对于这样的随机运动游戏来说听起来可能很高,但是您必须知道
主队大约有46%的时间获胜。因此,基本情况(不断预测主场获胜)确实具有46%的精度。
概率与赔率
当运行像SVM这样的多分类器时,您还可以输出概率估计并将其与投注赔率进行比较。看一下您的方差与赔率,并查看您对哪些游戏有非常不同的预测。
探索和可视化功能
通过访问玩家和团队的属性,团队组成和游戏中的事件,您应该能够对The Beautiful Game产生一些有趣的见解。谁知道,瓜迪奥拉自己有一天可能会雇用你们中的一个!