Sport et Statistiques : un mariage heureux
Article mis en ligne le 12 septembre 2016
dernière modification le 2 juillet 2017
logo imprimer

Dans le cadre de la semaine des mathématiques 2016, la Société Française de Statistique a organisé, en association avec l’académie de Créteil, un après-midi de conférence et d’échanges à l’Université de Marne-la-Vallée en direction des professeurs de mathématiques sur le thème « statistique et interdisciplinarité ». Ce texte est issu de la conférence intitulée « Comment mesurer l’efficacité collective de l’équipe de France de rugby à XV ? ».

Les liens entre statistique et sport sont anciens mais ils ont été fortement popularisés par Brad Pitt dans le film "Le stratège" (Moneyball en anglais). Ce film raconte comment Billy Beane, manager général des Oakland Athletics à la fin des années 90, créa l’une des meilleures équipes de baseball en utilisant les statistiques. L’idée était que le résultat de l’équipe était un mauvais prédicteur de la valeur individuelle et donc qu’il fallait mieux s’intéresser aux résultats individuels de chaque joueur. Ceci a permis de repérer les joueurs sous-évalués.


On pourrait penser que cette histoire est anecdotique mais la place des données dans le sport est de plus en plus importante. On voit de plus en plus d’entreprises privées dans la prise en compte des données chiffrées, l’American Statistical Association a une section consacrée au sport et le journal l’Équipe fait des dossiers spéciaux sur sport et Big data. L’institut de recherche biomédicale et d’épidémiologie du sport (IRMES) est un organisme public français consacré à la recherche biomédicale et épidémiologique du sport. L’IRMES est hébergé au sein de L’Institut national du sport, de l’expertise et de la performance (INSEP) et dirigé par Jean-François Toussaint (avec Geoffroy Berthelot et Adrien Sebeaud comme adjoint). les problématiques et les études sont nombreuses au sein de cet institut dynamique et une partie des graphiques de cet article provient de la thèse de Guillaume Saulière. De plus une partie des résultats a été obtenue en collaboration avec Pierre Barbillon, maître de conférence à AgroParisTech et Sophie Donnet, chargée de recherches à l’INRA.


Les règles du rugby à XV en font un sport très particulier que nous ne développerons pas ici. Le World Rugby (WR), anciennement International Rugby Board (IRB) est l’organisme international qui gère le rugby à XV. Depuis 1886, Il définit notamment les règles du jeu et organise les principaux tournois, notamment la Coupe du monde de rugby à XV depuis 1987. La France a joué (et perdu) son premier match international (contre l’Angleterre).

Les sommes d’argent impliquées dans le jeu ou l’évolution de la technologie expliquent en grand partie l’explosion de la quantité de données disponibles. Par exemple tous les joueurs (mais aussi la balle) sont équipés d’un GPS. Ceci se voit par exemple à la télévision dans les distances parcourues par les joueurs lors des changements. Une bonne partie des statistiques sont disponibles sur le site de la Fédération Française de Rugby (FFR). Outre les statistiques de tous les matchs, il est possible d’accéder aux caractéristiques individuelles (poids, taille, nombre de sélection, etc..). Nous avons là un exemple de données ouvertes (relativement) accessibles et réutilisables. C’est donc un terrain parfait pour un travail de statistique.

Notons qu’en 1995, l’IRB a supprimé les restrictions sur le paiement des joueurs. On peut par exemple se demander si cette décision a généré des (r)évolutions dans les caractéristiques des joueurs (en particulier poids et taille). La question que nous allons essayer de traiter concerne l’importance de l’expérience commune dans une équipe de rugby. Au rugby, les entraîneurs nationaux ont quatre ans pour former une équipe et il est donc important voir comment créer un collectif. Nous allons nous intéresser à la période 2012-2015 qui se solda par une défaite historique contre les néo-zélandais. Du site de la fédération de rugby il est facile d’extraire le nombre de sélections en équipe nationale de chacun des joueurs. On voit dans le graphique ci-dessous qu’il y a beaucoup de joueurs avec peu de sélections et que le record est de 118 sélections (Fabien Pelous).


Une autre approche plus intéressante est de regarder pour chacun des matchs le nombre de joueurs nouveaux (donc zéro sélection), le nombre de joueurs avec une sélection, le nombre de joueurs avec deux sélections, etc. Une équipe avec beaucoup d’anciens joueurs peut être considérée comme expérimentée et il est intéressant de savoir à partir de combien de sélections, les joueurs peuvent être considérés comme des piliers de l’équipe. Les données se présentent donc sous la forme d’un tableau de données avec autant de lignes que de matchs considérés et un nombre de colonnes obtenues en regardant le nombre de sélections. Ce tableau se prête bien à un traitement de statistique descriptive et on peut montrer avec une ACP (Analyse en Composantes Principales) qu’il y a d’un côté les joueurs avec zéro ou une sélection, d’un autre côté les joueurs avec deux, trois ou quatre sélections et enfin les joueurs avec au moins cinq sélections. Ceci donne donc une quantification précise à la notion d’expérience individuelle (pour une équipe nationale de rugby).

En plus de l’expérience individuelle on peut aussi compter le nombre de paires de joueurs avec une sélection commune, deux sélections communes, etc. On voit alors clairement que les joueurs avec au moins cinq sélections et les paires de joueurs avec au moins cinq sélections communes se différencient des autres joueurs. Une équipe expérimentée est donc une équipe avec des joueurs ayant l’habitude de jouer en équipe nationale ET ensemble. On pourrait regarder l’importance de jouer dans le même club.

Une approche simple de l’expérience collective est d’additionner le nombre de sélections de l’équipe et de chercher à relier ce score au résultat de l’équipe pour chaque match. On obtient alors un résultat contre-intuitif : plus l’équipe a de l’expérience et plus elle perd. Ceci s’explique (heureusement) par les adversaires. Il est rare de mettre une jeune équipe face aux grandes équipes de l’hémisphère sud (Australie, Nouvelle-Zélande ou Afrique du Sud). Il serait donc bon de corriger le résultat par la valeur de l’équipe. C’est l’un des buts du classement international des équipes (ici ou ) mais l’analyse sort de notre propos.

On pourrait continuer en regardant des graphes de jeux communs entre les joueurs ou en s’intéressant à d’autres sports. Par exemple il est assez facile de montrer que les meilleurs joueurs sont aussi ceux qui se blessent le moins. Le sport est donc un terrain privilégié pour la statistique et une illustration de la maxime, en général attribuée à H.G. Wells (1886-1946) : la pensée statistique sera un jour aussi nécessaire au citoyen que le fait de savoir lire et écrire.

Avner Bar-Hen

article suivant



retour au sommaire

Les chantiers de pédagogie mathématique n°170 septembre 2016
La Régionale Île-de-France APMEP, 26 rue Duméril, 75013 PARIS


Actus

Le Petit Vert de Lorraine

Le Petit Vert est le bulletin de la Régionale Apmep de Lorraine. Le n°132 du (...)

Math’Gic

Math’Gic est une création de professeurs de mathématiques de Gennevilliers. (...)

Brochure Jeux de l’Apmep

Une nouvelle brochure, en partenariat avec les Éditions du Kangourou, du (...)

Subvention de la Fondation Jacques Hadamard

La Fondation mathématiques Jacques Hadamard, dans le cadre de sa (...)

Actualités régionales

Débat à l’ENS

Un groupe de mathématiciens vous invitent à un débat à l’ENS (...)



pucePlan du site puceContact puceMentions légales puceEspace rédacteurs pucesquelette puce

RSS Valid XHTML 1.0 Strict

2013-2017 © APMEP Île-de-France - Tous droits réservés
Site réalisé sous SPIP
avec le squelette ESCAL-V3
Version : 3.87.59