Haut

Big Data, les nouveaux maîtres du jeu du journalisme sportif

En deux décennies, le Big Data a déferlé sur le monde du sport professionnel. Une masse d’informations sans précédent qui impose l’utilisation d’algorithmes toujours plus pointus. Des outils que les journalistes commencent à appréhender et à accepter en soutien de leur couverture des principales disciplines

Fini le temps où un rédacteur estimait de mémoire le tennisman ayant accompli le plus de grand nombre d’aces. Ou usait de sa plume plutôt que du chronomètre pour désigner l’équipe ayant monopolisé le ballon lors d’un match de foot. Dorénavant, la plupart des statistiques les plus triviales sont à portée de clic sur n’importe quel site web. Les journalistes ne s’en passent plus dans leurs papiers. Et s’enrichissent dans une sphère qui a vu naître et prospérer les algorithmes. Pour trier le flot astronomique de chiffres à disposition ou pour capter de nouvelles formes de statistiques qui intéressent les lecteurs, ces outils se sont rendus indispensables à tout un écosystème, où cohabitent clubs, sociétés de paris sportifs, fournisseurs de données et bien sûr… groupes de presse.

Opta, tout de go vers l’algo

Au commencement, il y a la data. Et pour se la fournir en 2020, le leader mondial de la donnée sportive Opta utilise encore… des mains ! “Nous considérons que l’humain est actuellement la seule manière de faire autant de volume de données précisément”, distille le senior vice-président Matthieu Lille-Palette, qui souligne que 350 indicateurs de données dites de performance (buts, passes, tacles…) sont agrégés pour un seul match de foot. “Trop pour un algorithme… Pour l’instant !” Certains médias les collectent aussi par eux-même, comme L’Équipe, dotée depuis 2000 de sa propre base de données. “A la main, on récupère les classements, les résultats, les buts…”, énumère Cyrille Le Guyon, journaliste au sein de cette base. 

Cette dernière, fruit d’années de travail, demande toutefois de pouvoir s’y retrouver. “Nos data scientists disposent d’un outil algorithmique, Qlik Sense, qui permet de ressortir, selon la requête, tel jeu de données.” Quand ce n’est pas en base, le média fait appel, comme bon nombre de rédactions aujourd’hui, à un prestataire externe. “Nous faisons pour notre part une demande à Opta et ils nous envoient une fiche détaillée”. Car le fournisseur, dont le groupe a fusionné en 2019 avec son concurrent américain Stats, s’enorgueillit d’une foultitude de savoir-faire. Sans jamais cesser les innovations. Dernières en date, les algorithmes de reconnaissance visuelle. “Grâce à des accords avec les ligues, nous avons dorénavant des caméras dans certains stades braquées sur les mouvements des joueurs de foot”, explique le directeur d’Opta.

Sensibiliser à la technologie

D’un côté, ces tracking data comme on les dénomme sont une mine d’or pour ceux qui veulent décortiquer les déplacements d’un joueur, son positionnement, ses dribbles… “Au lendemain du dernier France-Portugal [0-0 en Ligue des Nations], ces data ont fait apparaître la position reculée d’Antoine Griezmann, indique Cyrille Le Guyon. Ce fut un excellent moyen d’illustrer ou infirmer un ressenti qu’on avait eu.” La voie algorithmique offre en effet de nouvelles perspectives d’analyses. Canal+, diffuseur de quelques matches de Ligue 1 le week-end, a mis en place une “composition évolutive” au cours de la rencontre. “Un moyen pour le spectateur d’avoir des couches supplémentaires d’analyses tactiques en live”, éclaire Sébastien Audoux, responsable du contenu sportif et digital du groupe.

Ces sauts technologiques n’empêchent pas toutefois les réserves des uns et des autres. “Il faut que cela reste un outil, tempère le journaliste de L’Equipe. Au risque de tuer l’émotion.” Pour d’autres, les appréhensions techniques sont grandes et (parfois) justifiées : “On a fait appel à une start-up dans un premier temps, se rappelle Sébastien Audoux, qui a produit une web-émission “3-5-2” dédiée entièrement au foot et à la data. Cette solution utilisait le flux télé pour passer à la moulinette des matches entiers. C’était cool. Mais incroyablement complexe parce qu’on ne savait pas quoi faire de toutes ces données…” 

“Il y a une sensibilisation à mener auprès des journalistes sur ces questions, admet le dirigeant d’Opta. Ça faisait aussi pas mal d’années que les journalistes se cantonnaient aux données de performances classiques qui ne nécessitaient pas d’IA”. Le fournisseur met depuis peu à disposition des consultants pour “prendre le temps d’éduquer”. Le but : que les rédactions appréhendent plus vite les nouvelles recettes qui font florès. Audoux opine : “Il faut des experts à disposition pour conseiller et confronter les opinions…”

Vers le tennis et la gymnastique ?

Face à cette masse de données, le désir de tester des nouveaux formats a pris le dessus. Aux Etats-Unis, certains médias comme Five Thirty Eight jouent le jeu à fond en usant d’algorithmes prédictifs pour prévoir une saison à venir de NBA ou de base-ball. Jusque-là réservés aux entreprises de paris, ces systèmes commencent à faire leur chemin chez des diffuseurs. “Amazon a essayé un modèle de prédiction des matches de Premier League cette année, explique le senior vice-président d’Opta Matthieu Lille-Palette. Dazn [chaîne de streaming sportif] l’a intégré. Ca faisait le boulot d’un consultant en quelque sorte.“ Les perspectives sont grandes pour certains diffuseurs. “Le prédictif est un pari qu’on se faisait jusque-là avec soi-même, commente Sébastien Audoux. Cela permettrait de nouvelles analyses en live. “Ce shoot-là est raté alors qu’il avait 70 % de chances de rentrer ? D’accord !” 

Pour ce dernier, peu de doute que les médias suivront le train en marche. “Il y a sept ans, on a vu arriver d’un coup dans le golf un radar militaire, le trackman, raconte l’ex-rédacteur en chef de Golf+. Jusqu’ici personne ne pouvait analyser une balle à 250 km/h ! Cet outil nous a pourtant permis de savoir la trajectoire, la déviation, le nombre de rotations… Quelques années après, la chaîne Fox, qui avait gagné les droits de l’US Open de golf, l’a intégré dans sa diffusion !” Preuve supplémentaire du ruissellement technologique qui gagne les médias.

A court terme, bien des disciplines sont amenées à être concernées par les données et les algorithmes. Le rugby est déjà sur la voie. Le tennis attend quant à lui son tour. “Si on avait eu connaissance de la hauteur des balles suivant le lift cette année à Roland-Garros, on aurait pu mieux comprendre comment Rafael Nadal s’en est sorti face à Novak Djokovic…” regrette Cyrille Le Guyon. Autant de marchés amenés à se structurer. Parfois dans des disciplines qu’on relierait difficilement aux jeux de données statistiques. En 2019, le New York Times a émis le souhait de tester un algorithme de reconnaissance visuelle lors de compétitions de gymnastique. Le but? Sortir des éléments chiffrés à partir des captations photo des figures. Les idées ne manquent décidément pas. Plus qu’à dénicher les experts.

Le sport local attend encore sa révolution chiffrée

Si les médias de sport nationaux ont opéré un virage vers une utilisation poussée des données et algorithmes, la presse locale pourrait elle aussi se servir des avancées technologiques pour faire évoluer la couverture du sport. En France ou à l’étranger, certains acteurs sont favorables à l’usage de la data pour un traitement plus du sport local et amateur. Une perception loin d’être partagée par toute la profession.

Proposer un article sur une rencontre de basket féminin à l’échelle locale grâce au travail d’un algorithme. Recueillir le commentaire d’un entraîneur de badminton à la fin d’une rencontre par un système d’intelligence artificielle (IA). C’est aujourd’hui possible. En Scandinavie, Everysport, groupe de média suédois, collecte des données sportives pour alimenter ses propres sites d’information ainsi que les 75 journaux locaux qui font partie de sa clientèle. De quoi fournir à la presse locale un accès à un service de données sportives dit “fiable et rapide”. 

Le texto, l’algo et le coach 

Cet exemple illustre l’essor que connaît le recours aux algorithmes pour couvrir le sport régional. Depuis 2018, Everysport utilise un système automatisé d’interview d’entraîneurs en fin de match. Le principe est simple : dès les rencontres achevées, un texto interrogatif est automatiquement généré – sur la base de données comme la position au classement ou les résultats précédents – et envoyé aux coachs des deux équipes afin de recueillir leurs ressentis et commentaires. “Avec ce match nul, vous serez donc relégués. Comment réagissez-vous ? Qu’est-ce qui n’a pas fonctionné ?” Après réception, analyse et correction des commentaires par des modérateurs, ces derniers sont ensuite ajoutés à l’article préalablement publié.   

Pour Stefan Lundström, qui dirige la branche Data du groupe, l’IA offre aux rédactions locales la possibilité de couvrir tous les matchs disputés dans sa région, ce qui, selon lui, “est impossible à gérer manuellement”. A ses yeux, ceci est bénéfique à la couverture du sport local pour différentes raisons. “Les algorithmes donnent aux journalistes plus de temps pour traiter des sujets plus complexes que de simples résumés de matchs. Les papiers réalisés par des robots sont plus rapidement diffusés puisqu’ils sont publiés dès lors que le score final est connu. Ils sont donc partagés plus rapidement sur les sites et réseaux sociaux. Tout ceci implique une meilleure couverture mais aussi davantage de lecteurs et ainsi de revenus”, indique le manager.        

« Créer des idoles locales »

En France, la presse locale est encore souvent dépendante de l’humain et des quelques données fournies par les correspondants présents aux abords des terrains. C’est en tout cas ce qu’observe Vincent Lastennet, journaliste pour Le Télégramme. Membre de la cellule data du journal, il aimerait qu’une rédaction puisse “créer des idoles du sport local” ou soit en mesure de tirer le portrait d’un joueur, passé sous les radars, “qui aurait planté neuf buts”. 

Mais là encore, la donnée doit être structurée et surtout disponible. Pour mieux remonter les scores et les informations de match ? “On pourrait faire de l’applicatif pour obtenir de la donnée, en munissant nos correspondants d’une petite application pour géolocaliser, mettre les noms des buteurs… Comme ça, ça irait dans les bonnes cases…” Et dans un avenir proche, développer “un nouveau maillage entre correspondants et datajournalistes”.

Un manque d’attrait 

Certains acteurs de la presse régionale et hyper-locale jugent ce type d’analyse tournée vers les chiffres incompatible avec leur lectorat. Pour Julien Plazanet, membre de l’agence Rugby Média, qui collabore aussi avec des titres nationaux et locaux comme Midi Olympique et Sud Radio, “le lecteur ne recherche pas un éclairage par la donnée dans le sport amateur, à l’inverse du monde professionnel où l’analyse est poussée au maximum.” 

Une vision partagée par Nicolas Gosselin, fondateur du site web Ohvalie, spécialisé dans le rugby amateur. “L’humain est beaucoup plus important dans l’aspect presse locale d’hyper-proximité. Faire du portrait et mettre des gueules en avant avec de l’ambiance, c’est ça que nos lecteurs recherchent.” 

Après quelques infographies publiées sur des comparatifs de budgets et de subventions des clubs de Fédérale 1 en rugby (troisième division nationale), le rédacteur s’est vite rendu compte que son lectorat n’avait pas d’attrait pour cette forme de contenu. “Le ratio entre travail fourni et audience est négatif, contrairement à un simple article sur une personne ou une ambiance qui sera toujours bien reçu, précise t-il. Ce facteur est d’autant plus important dans une rédaction web qui se doit d’avoir un rendement accru.” 

Une touche humaine incontournable 

Pour ces deux journalistes sportifs, le coeur du problème s’avère être le manque crucial de moyens. Et c’est là que se creuse l’écart entre rédactions nationales et locales. Pour pallier ce déficit budgétaire, “certains bricolent”, ajoute Nicolas Gosselin.

Ce bricolage se résume en une prise d’informations mises à disposition gratuitement sur des sites internet, ou bien par certains clubs eux mêmes. Dans le monde de l’ovalie, le site Rugby Fédéral, “offre une part de data très utile, sur des informations basiques comme la nationalité, la taille ou encore le poids des joueurs. C’est rudimentaire à côté des grands médias”, argue le journaliste désormais employé par Actu.fr.Que la presse locale emprunte ou non la même voie que les médias nationaux quant aux données sportives, la touche humaine devrait rester substantielle dans le traitement du sport. Comme le concède Stefan Lundström, “ l’algorithme est très bon pour mettre en lumière des événements ou les points de données spécifiques pendant un match. Mais bien évidemment l’angle éditorial est mieux appliqué par un rédacteur humain. Des références historiques, aux émotions personnelles en passant par l’importance culturelle, l’humain apporte tant de perspectives en dehors de la data…”

Alexis Souhard, Paul-Guillaume Ipo et Erwan Morvan

Crédits : photo originale de Fanny SchertzerCC BY 3.0