auteur
Julien Assunção et @OMalytics

Du même auteur

> déconnerie

Le toucher de nez

> article précédent

Improbable dernière minute

Opta Forum 2017, une fenêtre sur le futur des statistiques ?

Le grand rendez-vous annuel de la data a ouvert quelques portes sur ce que pourrait être l'avenir d'outils d'analyses du football. Avec ce que cela comprend d'imperfections comme de promesses... Analyse détaillée.

Partager

 

Le 8 février 2017 a eu lieu à Londres le dernier "OptaPro Analytics Forum". C’est la quatrième itération de ce rassemblement d’analystes (plus ou moins) amateurs et de professionnels du sport autour de conférences sur la statistique dans le football. Comme son nom l’indique, cet événement est organisé par la société Opta, principal fournisseur de données statistiques.

 

La participation étant ouverte à tous, soixante-dix propositions de présentations ont été évalués par un panel de juges, qui en ont sélectionné onze. Il faut aussi ajouter celle de Dennis Lock, "Director of Analytics" aux Miami Dolphins (franchise de NFL). Voici les différentes tendances qui ressortent repérées lors de cet OptaPro Forum 2017.

 

 

L’arrivée des données de tracking

Grâce au partenariat avec TRACAB, Opta mettait pour la première fois à disposition des participants des "tracking data": des données détaillées qui suivent la position des vingt-deux acteurs et du ballon. Martin Eastwood a choisi de mettre à profit ces informations pour évaluer la prise de décision d’un joueur aux abords de la surface à partir de la position du porteur de balle, de ses partenaires et des adversaires. Probablement la première fois qu’un modèle combine Expected Goals et position des joueurs.

 

 

 

 

William Spearman s’en sert lui pour évaluer la probabilité de réussite d’une passe. Les données de TRACAB servent ici à définir les paramètres initiaux de la passe: emplacement/vitesse de la balle et des joueurs. Cela permet de mesurer les qualités de passeur d’un joueur de manière bien plus efficace que les modèles actuels en étudiant le pressing adverse mais aussi en isolant les qualités de contrôle de la cible, facteur que ne maîtrise pas le passeur.

 

À l’heure où placer "Big Data" un peu partout semble être tendance, le terme s’applique bien ici. Avec 3,51 millions de valeurs mesurées par match, on touche aussi la limite de ces mesures. Tout est démultiplié, la puissance de calcul mais aussi le nombre d’analystes nécessaires pour profiter de ce foisonnement de données. Difficile donc de s’en servir en cours de match.

 

On imagine toutefois assez vite l’impact que peut avoir leur utilisation, notamment sur tout l’aspect défensif, où le principal se passe sans le ballon. La prise en compte des défenseurs dans un modèle d’Expected Goals par exemple, mais aussi connaître la distance moyenne entre un défenseur et son vis-à-vis. Le champ des possibles est tellement important qu’il faudra savoir sélectionner les informations pertinentes. Impossible également d’imaginer les blogeurs amateurs avoir accès à ce type de données. Une révolution qui devrait donc se faire dans l’ombre?

 

 

Les Expected Goals comme outils

En parlant d’Expected Goals, ceux-ci ne sont plus utilisés comme une fin en soi mais comme un outil de mesure. C’était le cas dans la présentation de Martin Eastwood, où l’auteur considère qu’une bonne décision est une action qui maximise la valeur de l’Expected Goal. Par leur caractère plus objectif et prédictif, ils peuvent donc remplacer les buts pour estimer la réussite d’une stratégie. Ils sont également de plus en plus utilisés en association avec un autre modèle statistique.

 

On ressent cette évolution dans la conférence de Neil Charles sur la manière d’optimiser les zones de tirs, où ils sont combinés à un modèle estimant la difficulté d’une passe. Le but étant de définir la frontière où tirer devient une meilleure option que la passe vers un coéquipier.

 

"Probabilité de marquer des différentes options de Ross Barkley"


 

Les Expected Goals sont un outil de diagnostic puissant mais limité tactiquement. Une fois que l’on connait les zones préférentielles de tirs, on a besoin de savoir comment y accéder. Une démarche que l’on retrouve dans la présentation de Garry Gelade sur l’art de centrer, lequel explore les types de centres les plus efficaces. Alors que cette statistique fait son entrée dans les médias grand public (BBC, Canal+, etc.), elle a déjà été plus ou moins digérée par les analystes, qui passent désormais à l’étape suivante.

 

 

Des tirs aux passes

L'intérêt des analystes s'est en effet d'abord concentré sur les tirs, pour l'importance qu'ils ont quant au résultat final mais aussi car les données sont plus accessibles et relativement simples à manipuler. Pour autant, ce sont bien les passes qui constituent le cœur du football et l'action la plus courante exécutée par un joueur. D'où l'investissement progressif de ce secteur du jeu.

 

 

"Évolution des différents types d’attaque en proportion des tirs (PL saisons 12/13 à 16/17)"

 
 

L'étude des passes a de plus l'avantage de se rapprocher des préoccupations tactiques des entraîneurs, et donne lieu à une variété d'approches que les tirs n'offraient pas:

 

• Une approche stylistique ou qualitative comme celle de Will Gürpinar-Morgan qui montre comment identifier et analyser les stratégies d’équipe, ou celle de Bobby Gardiner et Joel Becker relative aux entraîneurs et leur style de jeu, qui se servent également des passes pour créer un certain nombre de métriques qualitatives.

 

• Une approche quantitative comme celle de William Spearman qui utilise les données de tracking pour aller au-delà du simple pourcentage de passes réussies et évaluer les passes de manière holistique.

 

• Une approche hybride par David Perdomo Meza qui identifie des tendances au niveau collectif uniquement sur la base des joueurs qui composent les séquences de passes et qui en déduit ensuite une évaluation individuelle.

 

On le voit, l'attention portée aux passes est pleine de promesses et représente également une opportunité unique d'appliquer un éventail d'outils mathématiques qui vont de la topologie aux algorithmes d'intelligence artificielle.

 

 

 

De nouveaux outils statistiques

Les articles de la communauté "Football Analytics" s'appuient sur un éventail d'outils statistiques de plus en plus large et le forum 2017 nous en a donné une belle illustration. Bien qu'elles ne soient pas nécessairement nouvelles, l'utilisation publique de ces techniques appliquées au football est en revanche relativement récente.

 

Martin Eastwood a navigué entre différentes méthodes pour son application: "réseaux neuronal", "machines à vecteurs de support", avant d’opter pour une régression logistique plus classique. Neil Charles a lui utilisé un algorithme dit "forêt d’arbres décisionnels" pour créer son modèle d’Expected Passes.

 

 

"Forêt d’arbres décisionnels"

 
 

Ces méthodes complexes à appréhender mais relativement simples à implémenter donnent bien souvent des résultats plus précis (au prix parfois d’un besoin calculatoire plus important) mais pèchent par l’interprétabilité de leurs résultats.

 

On touche ici à notre avis à la principale barrière à l'entrée des statistiques dans le football: pour être adoptés par les principaux acteurs du secteur sportif d’un club, il faut que les résultats soient compréhensibles et assimilables par des non-initiés. Les analystes ont de leur côté un travail à faire pour présenter le résultat de leur travail avec pédagogie et honnêteté.

 

Via la présentation de Constantinos Chappas sur l’incertitude des métriques, on voit comment peut (doit?) être présenté le travail d’un analyste: en montrant de manière explicite les données utilisées, les calculs et surtout le niveau de confort quant aux résultats des travaux.

 

 

 

 

Pour cela, l’approche dite bayésienne et les intervalles crédibles qu'elle permet de calculer sont à la fois relativement transparents et simples à appréhender. Plutôt qu’un intervalle de confiance, souvent mal interprété, l’intervalle crédible nous donne le pourcentage de chance qu’un paramètre soit compris entre deux valeurs. Les modèles ont par nature un niveau inhérent d'incertitude et il convient d'en informer les utilisateurs.

 

Le chemin est donc étroit pour les statistiques dans le football, qui doivent naviguer entre de multiples écueils: la complexité des méthodes, la difficulté d'interprétation des résultats, la sur-simplification mais aussi faire face aux réticences d'un sport dont la plupart des acteurs doivent encore être convaincus de leur pertinence.

 

 

De l’importance du style de jeu

Une autre tendance de ces derniers mois et que l’on retrouve sur cet OptaPro Forum est l’emphase mise sur la manière plutôt que le résultat.

 

Il est évidemment intéressant de savoir quelles équipes/joueurs sont les plus performants, mais savoir analyser le style de jeu utilisé a de nombreux avantages. Il permet, par exemple, de se préparer à un type d’attaque en particulier ou exploiter une faiblesse de l’adversaire. Cela importe également dans la phase de recrutement, où il ne suffit pas de prendre un bon joueur/entraîneur pour que son arrivée soit une réussite. D’autant plus que la plupart des statistiques sont d'ordre stylistique, donc grandement influencées par l’équipe dans laquelle un joueur évolue.

 

 

Côté joueurs, David Perdomo Meza aborde le sujet en utilisant les séquences de passes et Will Gürpinar-Morgan en s’intéressant aux différents types d’attaque selon la façon dont sont menées les phases de possession. Dans ces deux présentations, Leicester City est un cas d’école, une équipe systématiquement à part.

 

Bobby Gardiner et Joel Becker se sont, eux, posés une question: le style de jeu dépend-il des entraîneurs? Cela peut sembler évident mais c’est important de le chiffrer, notamment pour éviter des nominations parfois vouées à l’échec. Dans un sport qui brasse autant d’argent, les présidents de club doivent le moins possible laisser la place au hasard.

 

 

Conclusion

Le forum Opta est un des rares lieux (après Twitter) où les analystes amateurs peuvent présenter leur travail aux acteurs du monde professionnel. Ces amateurs sont de plus en plus nombreux sur internet mais, paradoxalement, les travaux novateurs semblent se tarir. Les "fanalysts" oscillent en effet entre peur de voir leurs productions récupérées directement par les clubs et besoin de se faire connaître.

 

Un intérêt des clubs qui se matérialise par les cinquante équipes représentées au forum, que ce soit au niveau de l’équipe première ou du centre de formation. Avec de l’avance pour les équipes anglaises et allemandes, le Paris Saint-Germain étant le seul représentant français. Pour autant, les passerelles fonctionnent-elles réellement? On compte actuellement sur les doigts d’une main les amateurs passés pros au sein de clubs. Est-ce une question d’offre (les clubs n’ouvrent pas de recrutements sur ce type de poste), de demande (les profils disponibles ne correspondent pas aux besoins) ou de canal de recrutement (les clubs piochent en dehors de la communauté)?

 

L’exemple des sports américains tend à nous faire pencher vers la première option: la valeur des statistiques est reconnue au sein des clubs mais la création d’équipes de statisticiens / data scientists en interne met du temps à se mettre en place ou se fait en interne via l’utilisation de staff déjà présent (analystes vidéo en particulier). Reste à savoir si c'est le meilleur moyen de tirer parti de toutes ces données.

 

Aussi étonnant que cela puisse paraître, c’est l’argument financier qui est souvent avancé par les clubs refusant d’investir dans ce domaine. La mise en place d’un service dédié à l’analyse statistique et l’obtention des données nécessaires a effectivement un coût mais celui-ci paraît faible en comparaison des millions d’euros que peuvent coûter un transfert raté ou une série de défaites. Il est aussi nécessaire qu’une nouvelle génération d’entraîneurs, avec un œil bienveillant sur ces nouvelles technologies, prennent en main les clubs – une collaboration profonde étant nécessaire. L’objectif final, lui, est toujours le même: "Comment faire gagner mon équipe?".

 

 

Pour ceux que cela intéresse, toutes les présentations sont détaillées chez CôtéStats.

Partager

> déconnerie

Le Diaporama de Noël

> du même auteur

Mauvais sang

Cultures football


Rémi Belot
2018-06-21

De l'art ou du ballon ?

Les Magasins généraux de Pantin (93) accueillent "Par amour du jeu", exposition des œuvres d’une trentaine d’artistes qui revisitent les liens entre football et art contemporain. Drôle et fascinant. 


Joe Kennedy
2018-04-16

Neville Southall, des dégagements à l'engagement

When Saturday Comes – Les commentaires de l’ancien gardien de but d’Everton et du Pays de Galles sur les médias sociaux en ont fait un héros de la gauche, tout en montrant que le football pouvait s’affranchir de sa culture viriliste.


Christophe Kuchly
2018-04-02

La Métamorphose de Guardiola

Bibliothèque – Dans Pep Guardiola: la Métamorphose, Marti Perarnau raconte de l’intérieur les trois années passées par l’entraîneur catalan au Bayern Munich. Et essaie de décrypter l’évolution de sa méthode dans un contexte bien moins favorable qu’à Barcelone.


>> tous les épisodes du thème "Cultures football"

Sur le fil

RT @popandkop: Le "Last night a Didier saved my life" des @cahiersdufoot est dans le top 5 des t-shirts des Bleus selon @GALAfr . On peut m…

Toujours le même discours: trop de matches de sélections, mais pas trop de matches de clubs, bien entendu. Et les b… https://t.co/mkw4m4ejEE

"Emmanuel Macron a fini par saturer les images et nuire autant à la célébration qu’à son autocélébration" -… https://t.co/0Bel28eX4h

Les Cahiers sur Twitter

Le forum

Observatoire du journalisme sportif

20/07/2018 à 23h58 - Run : Tonton Danijelaujourd'hui à 23h31Oui, clairement, Run, ce qui est acquis est acquis. Mais par... >>


Café : "Au petit Marseillais"

20/07/2018 à 23h55 - lunatic XV : (À la limite un (res)sentiment un peu adouci par leur nombre de minutes de jeu cumulées, certes) >>


Toujours Bleus

20/07/2018 à 23h45 - José-Mickaël : Tonton Danijelaujourd'hui à 22h46> Bref, arrêtons l'autoflagellation: nous sommes un beau... >>


Foot et politique

20/07/2018 à 23h44 - Run : Tonton Danijelaujourd'hui à 17h45Runaujourd'hui à 17h17Vu que cette affaire touche le foot... >>


Espoirs, des bleus et des verts

20/07/2018 à 23h18 - Run : On sait pas sur quoi cela va deboucher mais Gouiri c'est 9 matchs en competitions estivales (5 euro... >>


Dijonnais en paix

20/07/2018 à 23h15 - CHR$ : C'est rigolo, le message de Didier Feco m'avait échappé (ou j'ai oublié depuis début mai). Mais... >>


Oh mon maillot

20/07/2018 à 22h55 - Run : Dans le meme ordre d'idee, ou pas, le club de Watford a decide de lancer ses maillota et les faire... >>


Les pseudos auxquels vous avez échappé ...

20/07/2018 à 22h51 - Pascal Amateur : Oui, avec mes amis LR que la droite honore. >>


CdF Omnisport

20/07/2018 à 22h47 - 2Bal 2Nainggolan : OK j'ai ma réponse. J'ai pas vu l'arrivée du jour et j'ai chopé une vidéo du final où on voit... >>


Dans le haut du panier

20/07/2018 à 22h44 - Tricky : De manière générale, je ne suis pas complètement certain de comprendre exactement ce que veut /... >>


Les brèves

Pepe honni

"Reina, gardien de Naples, dénoncé pour ses liens avec la mafia italienne." (20minutes.fr)

Mendycité

"Mendy : ‘J’ai la dalle’.” (lequipe.fr)

Pas Metz que un club

"Metz : Un groupe amoindri." (lequipe.fr)

DSKudetto

“Maurizio Sarri : ‘On a perdu le titre dans un hôtel’.” (lequipe.fr)

Mousse à mazout

"Sarr : ‘Il ne faut pas nous enflammer’." (sofoot.com)