Coupe du Monde : le big data s’est encore spectaculairement raté dans ses prévisions

La France a gagné la Coupe du Monde face à la Croatie… et le big data n’a pas su le devenir. Après le fiasco de l’élection présidentielle de 2017 -les prédictions des spécialistes des données contredisaient les sondages en voyant François Fillon se qualifier pour le second tour-, bis repetita pour la Coupe du Monde. L’affiche de la finale, France vs Croatie, n’a été correctement annoncée par aucun des acteurs qui se sont risqués au jeu des prédictions sur la base du big data et du machine learning, une méthode de calcul relevant de l’intelligence artificielle. L’objectif était de tester leurs algorithmes et d’évaluer leurs progrès, eux qui avaient déjà échoué à prédire le vainqueur lors des précédents mondiaux de football.

Lire aussi : Présidentielle : le big data éliminé dès le premier tour, revanche des sondages

Les banques ont eu tout faux

Trois banques -UBS, Goldman Sachs et la Commerzbank- se sont prêtées au jeu en transposant sur le terrain du football leurs modèles d’analyse habituellement réservés à la prédiction économique. La palme du raté le plus spectaculaire revient au suisse UBS. Ses algorithmes ont calculé la probabilité pour les 32 nations présentes en Russie de soulever le trophée, en prenant notamment en compte les résultats des cinq précédentes Coupes du Monde, les performances précédentes des équipes nationales, mais aussi la façon dont se sont qualifiées les équipes pour ce Mondial 2018 ainsi que “l’imprévisibilité” du sport, comme les blessures des joueurs.

Lire aussi : Et pour Goldman Sachs, le vainqueur de la Coupe du monde est…

Résultat : UBS pensait que le vainqueur le plus probable était l’Allemagne, avec 24% de chances de gagner, suivie par le Brésil (20%) et l’Espagne (16%), qui cumulaient à eux trois 60% des chances. Le Royaume-Uni, demi-finaliste surprise, figurait très loin en quatrième position (8,5% de chances de gagner). Quant à la France, elle n’arrivait que cinquième (7,3%). Pis : la banque ne misait pas une pièce sur la Croatie, créditée de 0,2% de chances de victoire et de 0,9% de chances de se hisser en finale… On connaît la suite : la Mannschaft a été éliminée dès la phase de poules et le Brésil a été sorti en quarts par la Belgique.

Du côté de l’américain Goldman Sachs, on se glorifiait de recourir à des méthodes de machine learning sophistiquées, capables de mouliner un nombre impressionnant de paramètres pour fournir des prédictions d’une grande finesse. La banque a nourri son algorithme de statistiques variées : caractéristiques des joueurs (passes décisives, tacles par match etc.), nombre de buts marqués par l’équipe, performance générale et en fonction de chaque match de la Coupe du monde depuis 2005. Verdict : à l’issue d’un million de simulations d’évolutions de la compétition, la banque d’investissement voyait l’Allemagne battre le Brésil en finale, la France “malchanceuse au tirage” devant s’arrêter en demi-finales.

Enfin, le groupe allemand Commerzbank, qui a ajouté à ses paramètres de calcul la valeur des joueurs sur le marché, les favoris étaient encore l’Allemagne et le Brésil.

EA Sports prédit parfaitement le parcours de la France… mais la voit gagner en finale face à l’Allemagne

Si l’analyse prédictive ne sort pas grandie de la Coupe du Monde -en grande partie à cause de la beauté de l’imprévisibilité du sport-, un autre acteur a fait un peu mieux que les banques. Il s’agit d’EA Sports. L’éditeur de jeux vidéo a profité de la mise à jour de son jeu dédié à la Coupe du Monde 2018 pour effectuer, en mai dernier, une simulation de la compétition qui donnait la France championne du monde après une victoire à l’arrachée… mais face à l’Allemagne. L’éditeur aura au moins su prédire l’un des finalistes, mais cela ne suffit pas à redorer le blason de l’exercice de la prédiction sportive.

Sa méthode, qui donne davantage d’importance à la valeur marchande des joueurs,  semble toutefois plus pertinente que celle des banques. Car EA Sports a su prédire parfaitement le parcours des Bleus : victoire contre l’Argentine en huitièmes de finale, contre l’Uruguay en quarts et contre la Belgique en demi-finales. Mais la France affrontait -et battait- l’Allemagne en finale. Si cela peut consoler les supporters, EA Sports avait correctement prédit la victoire finale de l’Allemagne en finale et s’était aussi trompé d’adversaire : à l’époque, son IA avait désigné le Brésil alors que la Mannschaft avait battu l’Argentine. Bis repetita en 2018, mais avec la Croatie dans le rôle du finaliste surprise.

Articles en lien