Prédictions basées sur l’IA pour le Super Bowl LIV : Touchdown pour les analyses sportives

DataRobot Superbowl

Cet événement incontournable de la pop culture américaine opposera ce dimanche 2 février 2020, à Miami, les Chiefs de Kansas City aux Forty-Niners (49ers) de San Francisco dans une affiche inédite. Pour rappel : le Super Bowl, ce n’est ni plus ni moins que la finale du championnat nord-américain qui se tient depuis 1967. 

Au-delà de l’histoire, ce jeu représentera également un affrontement classique dans les styles. Tout au long de la dernière saison, les Chiefs ont privilégié une stratégie offensive agressive, tandis que les 49ers ont misé sur une solide défense.

Un vieil adage dit (vrai ou non) 🤔 : « la défense gagne les championnats ». Alors, que verrons-nous jouer le 2 février ?

Andrew Engel (Directeur Sports & Gaming de chez DataRobot) a couru les modèles pour voir quelle équipe a plus de chances de gagner le Super Bowl LIV…. 🏆

Les résultats ? Roulements de tambour…. 🥁

 

Nous prévoyons que les Chiefs de Kansas City remporteront le Super Bowl LIV avec une probabilité de 63,5% et une marge de 5,5 points . 

Les méthodes ? 🤔

 

L’approche d’Andrew s’appuie sur les prédictions faites par FiveThirtyEight à partir des notes Elo des équipes et de leurs quarts-arrière. À partir des données de FiveThirtyEight, Andrew a cherché à prendre également en compte les impacts respectifs de l’offensive et de la défense de chaque équipe. Il a créé des fonctionnalités représentant la façon dont l’attaque ou la défense de chaque équipe se compare à l’autre et à la moyenne de la ligue.

Andrew a introduit ces données dans la plate-forme DataRobot , entraînant le modèle sur des jeux remontant à 1950 afin de prédire la marge de victoire. À partir des prédictions historiques de ce modèle, Andrew a ensuite calculé son erreur et entraîné un autre modèle DataRobot à prédire l’erreur pour la marge de victoire d’un match donné.

En utilisant la marge de victoire et d’erreur attendue, Andrew a simulé 10000 matchs entre les Chiefs de Kansas City de cette saison et les 49ers de San Francisco, y compris des caractéristiques telles que leurs notes d’équipe et de quart Elo, et des performances offensives et défensives. Dans ces 10 000 Super Bowls simulés, les Chiefs de Kansas City ont remporté environ 6 350 matchs. C’est-à-dire que si le Super Bowl devait être joué 100 fois, nous prédirions que les Chiefs gagneraient environ 64 matchs.

Ci-dessous, nous explorerons comment le modèle fait ces prédictions.

Une analyse 📊

 

Les lignes jaunes indiquent des fonctionnalités qui sont peut-être redondantes avec d’autres, et partagent beaucoup d’informations. 

Le graphique ci-dessus classe les entités par puissance prédictive pour ce modèle particulier, via une méthode appelée importance de permutation. Dans les quatre meilleures fonctionnalités, nous voyons toutes les notes de l’équipe et du quart-arrière Elo, qui réussissent clairement à capturer une grande partie du signal. Mais les contributions des statistiques offensives et défensives respectives comptent également et représentent un domaine qui pourrait être exploré plus avant pour améliorer le modèle. Parmi eux, la caractéristique la plus importante de ce modèle est la force offensive de team_1.

Nous pouvons explorer à quel point les performances offensives et défensives informent le résultat via des graphiques de dépendance partielle, comme ceux ci-dessous :

La marge de victoire, dans le modèle appelé «score_diff», est calculée comme la différence entre le score de «team_1» et «team_2» (qui sont arbitrairement attribués pour un match donné). Ainsi, pour les matchs dans lesquels team_1 a gagné, la marge de victoire sera positive; tandis que dans les matchs où team_2 est le vainqueur, ce sera négatif. Pour cette prédiction particulière, nous avons affecté les chefs à l’équipe_1.

Dans l’intrigue ci-dessus, la marge de victoire de l’équipe_1 augmente pour de meilleures performances offensives lors des matchs de la saison précédente. L’inverse est vrai dans l’intrigue ci-dessous concernant la défense de l’équipe_1, représentée par les points accordés.

Enfin, dans ce graphique de dépendance partielle pour les performances défensives de team_2 par rapport à la ligue, il convient de noter que plus la «marge de victoire» est faible, meilleure est la team_2. Ainsi, pour que team_2 ait été plus susceptible de gagner, le plus bas sera le mieux pour le ratio «team_2_def_league».

L’image formée à partir de ces parcelles de dépendance partielle et de leur importance complique certainement la notion selon laquelle « la défense gagne les championnats ». Quoi qu’il en soit, cette analyse semble légèrement favoriser le contraire, ce qui serait une bonne nouvelle pour Kansas City. Une analyse plus approfondie fournirait des informations plus approfondies sur ce qui importe le plus, l’infraction ou la défense.

Conclusion

 

Une probabilité de 63,5% n’est pas une victoire assurée, mais dans le monde des prédictions de championnats sportifs, cela fait des Kansas City Chiefs, et leur cinquième plus haut score dans la ligue cette année, d’assez bons favoris.

 

Laissez un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.