Cruyff

04 avril 2016

Le jeudi de la semaine sainte, mais cela n'a rien à voir avec la semaine sainte, surtout pas, c'était simplement le jeudi 24 mars de l'année 2016, nous avons appris la mort du néerlandais le plus célèbre avec Mata-Hari et Spinoza (on pourrait ajouter Erasme, Rembrandt, Huyghens, la reine Wilhelmine, van der Laan). Nous avons nommé Johann Cruyff.

Non seulement, c'est sans doute un des trois plus grands joueurs (de football) de tous les temps, sinon le plus grand, avec cette manie des classements et des comparaisons qui taraude l'humanité. Et pour paraphraser nous ne savons plus qui, il figurerait en excellente place dans notre Top One. Mais il aura brillé aussi par quelques propos dont la portée philosophique le dispute à la portée scientifique. Avec un fort penchant pour la statistique. Jugez-en.

Je ne suis pas croyant. En Espagne, les vingt-deux joueurs se signent avant d'entrer sur le terrain. Si ça marchait, tous les matchs se finiraient sur un match nul. Dans sa jeunesse, il changeait à plaisir le rythme des chœurs religieux qu'on lui imposait de chanter; pour le punir, le pasteur lui faisait copier cent fois le précepte je ne suis qu'un grain de sable.

Quand vous jouez un match, il est statistiquement prouvé que les joueurs n'ont la balle que trois minutes en moyenne. Le plus important, c'est donc ce que vous faites pendant ces quatre-vingt-sept minutes où vous n'avez pas la balle. C'est ce qui fait que vous êtes un bon joueur ou non. La perspective a de quoi rendre optimiste et relativise le quolibet classique du mauvais joueur qui a des pieds qu'on dit carrés.

Parc  des
Princes
Parc des Princes
(Nicolas de Staël, 1952, collection particulière)

Les applications de la statistique au sport vont bien au-delà de l'établissement et de l'exploitation des statistiques descriptives (occasions, buts, arrêts; occupation du terrain, maîtrise du ballon, distance parcourue; duels emportés, coups francs, touches, fautes, etc. — le tout collectivement ou individuellement) qui, depuis une vingtaine d'années, jouent un rôle de plus en plus important dans la préparation des équipes. Ainsi, récemment, d'éminents statisticiens italiens (Masarotto et Varin, M&V, M ou V étant par ailleurs fan de jazz, de football et amateur de totocalcio) ont élaboré une procédure statistique pour le classement d'équipes à partir de l'ensemble des résultats de rencontres.

Les championnats de football ont ceci de particulier que si N équipes y participent, alors tous les 2 × N × (N-1) matches pouvant opposer une équipe à une autre à domicile et à l'extérieur sont disputés. Le classement des équipes à l'issue du championnat est alors aisé: chaque équipe engrange un certain nombre de points selon les nombres de ses victoires, matches nuls et défaites, et l'équipe a est mieux classée que l'équipe b si elle totalise davantage de points (avec une règle en cas d'égalité). La procédure permet alors de prédire le résultat de matches qui n'ont pas (encore) eu lieu ou de détecter des fraudes.

Pour d'autres sports et championnats (National Collegiate Athletic Association College Hockey, National Football League), il arrive que le nombre N d'équipes participantes soit si élevé que seule une fraction du total de 2 × N × (N-1) matches pouvant être théoriquement disputés le soit effectivement. En plus de permettre la prédiction de résultats ou la détection de fraudes, la procédure permet alors aussi de classer les équipes, au terme du championnat, sur la base des résultats des rencontres disputées sans appliquer la règle de classement fondée sur la comparaison du nombre de points remportés. Cette dernière est en effet discutable dans la mesure où il est impossible de garantir que toutes les équipes sont équitablement traitées.

La procédure de M&V repose sur quatre idées maîtresses: chaque équipe se voit associer un paramètre qui reflète son niveau absolu, de telle sorte que si le paramètre de l'équipe a est supérieur à celui de l'équipe b, alors la première est supérieure à la seconde; un indicateur de jeu à domicile ou à l'extérieur permet de différencier les deux cas; l'ajustement est effectué au sens du maximum de vraisemblance, c'est-à-dire que de tous les modèles en compétition, celui le plus en accord avec les observations est préféré; la maximisation est faite sous contrainte de parcimonie, la procédure étant artificiellement incitée à constituer des paquets d'équipes de niveau similaire pour diminuer le nombre de paramètres à estimer.

Les résultats de prédiction sont les plus faciles à évaluer. On peut, par exemple, ajuster le modèle en écartant les résultats de matches ayant pourtant bien eu lieu, prédire leurs issues, puis comparer les prédictions aux résultats. Dans cet esprit, M&V démontrent la qualité des résultats produits par leur procédure. Il n'est pas improbable que Cruyff s'y soit intéressé. Tout porterait à le croire ou l'imaginer.

Cruyff aimait à dire que le hasard est logique. Il est mort à soixante-huit ans — comme Cervantès, et quelques autres.

Billet suivant