Lorsque l'on ne connaît pas bien quelque chose ou que l'on ne l'a pas testé intensivement, il est difficile d'en évaluer le plein potentiel. Dans ce blog, nous montrons comment nous utilisons notre approche et différentes méthodes et fonctions mathématiques pour appliquer une exploration intelligente et complémentaire des données afin d'exploiter au maximum le potentiel.
Le datascouting est une identification des joueurs et non une sélection.
Le datascouting n'a pas pour objectif de trouver le meilleur joueur, mais de trouver beaucoup de bons joueurs. Les profils d'un très grand nombre de joueurs sont analysés afin d'éliminer ceux qui ne conviennent pas. Plus le profil de recherche est détaillé, meilleur est le filtre et meilleur est le résultat.
Les données ne sont pas utilisées pour trouver le meilleur joueur. Mais pour déterminer rapidement les 50 meilleurs joueurs parmi les 1'000 disponibles, parmi lesquels les 10 meilleurs ont de grandes chances de figurer (pré-scouting). Cela permet de gagner un temps précieux lors du #scouting, car les Scouts peuvent se concentrer sur un petit nombre de joueurs sans devoir en passer des centaines au crible. Déterminer les meilleurs parmi les candidats reste la tâche des scouts avec leur expertise et leur expérience.
Le scouting de données analyse tout le monde du football en un seul clic
Combien de temps vous faut-il pour estimer grossièrement si un joueur correspond ou non à votre profil de recherche ? Cinq ou dix minutes ? Avec dix minutes, il vous faut environ 16 heures pour 100 joueurs. Un algorithme peut le faire en une minute pour 100 000 joueurs. De plus, les données permettent de trouver des joueurs surprenants et moins chers, car la demande est moins importante en dehors de la recherche standard de masse. Le scouting de données garantit que l'on ne se focalise pas trop vite sur des joueurs isolés ou recommandés, mais que l'on cherche dans tout le spectre. Même là où l'on ne s'attend pas à trouver quelque chose.
D'un point de vue purement statistique, on peut dire, en raison de la quantité et de la variance, que l'on trouve vraiment un talent de la décennie dans chaque ligue.
Le scouting de données réduit la dépendance vis-à-vis des conseillers
Il y a encore beaucoup trop de clubs qui pratiquent un scouting en grande partie réactif. Les agents leur proposent plusieurs joueurs par jour et les recruteurs doivent fournir beaucoup d'efforts pour une évaluation rapide et, pour la plupart, un refus. Beaucoup d'efforts pour des joueurs qui ne les intéressent pas du tout.
Avec cette approche réactive, les clubs se concentrent beaucoup trop tôt sur un petit nombre de joueurs. Ils ne pêchent pour ainsi dire que dans l'étang des agents/conseillers et dans leur intérêt. Mais si l'on utilise les données pour identifier les joueurs adéquats, on peut inverser le jeu et pêcher dans les mers du monde. Et ensuite, si nécessaire, aller à la rencontre des conseillers concernés. Change the game.
Data Scouting - Processus de scouting des données
Le processus de scouting idéal commence par le scouting des données (pré-scouting).
Tous les profils des joueurs disponibles sont analysés. Le résultat est une liste de candidats de 30 à 100 joueurs. Ensuite, les candidats sont évalués par les recruteurs à l'aide d'un scouting vidéo et en direct.
english article: data driven scouting
Maturités dans l'utilisation des données dans le scouting
Sur la base des expériences et des discussions avec des clubs nationaux et internationaux, nous pouvons classer les clubs selon les niveaux de maturité suivants dans l'utilisation des données.
Utilisateur : les scouts utilisent des données dans des outils de fournisseurs professionnels. Les statistiques des joueurs et les métriques sont ainsi comparées de manière simple et standardisée. Scouting réactif selon les recommandations de conseillers/agents.
Individuel : pas de ressources analytiques propres. Les ressources de scouting existantes sont en outre chargées de tâches d'analyse. Les données sont exportées des outils et analysées dans des applications tierces telles qu'Excel, Tableau, Power-Bi en fonction des besoins spécifiques de l'association. Développent leurs propres KPI spécifiques au club. Mélange entre scouting réactif et préventif. Souvent, aucun processus de données cohérent n'est mis en œuvre dans le scouting.
Analyste : les clubs disposent de ressources d'analystes dédiées qui travaillent avec les scouts. Utilisent des KPI, des logiques, des algorithmes et des fonctions mathématiques avancés dans le scouting de données. L'exploration des données et les décisions basées sur les données sont établies par toutes les parties prenantes du scouting et, le cas échéant, de l'analyse des matches.
Équipes d'analystes : disposent d'équipes complètes d'analystes, de data scientists et de mathématiciens. Adoptent une approche scientifique et développent leurs propres méthodes et logiques d'analyse des données. La culture des données est établie dans toute l'association.
Rien n'empêche d'utiliser des outils standardisés. Ceux-ci sont très avantageux et très bons. Mais pour reconnaître et exploiter le potentiel de l'analytique, il faut aussi investir dans les personnes, les ressources propres et le savoir-faire.
Chaque association devrait envisager d'explorer elle-même ce potentiel. En ce moment, les associations recherchent presque quotidiennement des analystes de données, pour créer ou renforcer leur département d'analyse.
Les nouvelles technologies ont toujours le potentiel de transformer les systèmes, de déplacer les rapports de force et de modifier les exigences des postes de direction.
L'analyse des données nous dit que le joueur en question correspond au profil de recherche et qu'il a réalisé de bonnes performances. Mais les données ne sont qu'une vision spécifique. Comme un œil ou une perspective supplémentaire. Comme toute autre perspective, elle n'est pas la seule vérité. Mais il serait insensé de dédaigner cette perspective pour prendre des décisions importantes.
La vision des données est dans tous les cas une valeur ajoutée. Soit elle confirme notre propre perception, soit elle nous oblige à regarder de plus près.
Tous les clubs utilisent les données pour comparer les joueur et à faire du scouting. Mais rares sont les clubs qui exploitent exploitent vraiment tout le potentiel.
Pour que le scouting soit un succès durable et systématique, il faut que différentes personnes et différents groupes travaillent bien ensemble et que certaines choses positives soient réunies. En d'autres termes :
Dans les domaines de la connaissance, des compétences, de la communication, des processus et de la gestion, il existe un nombre incroyable de possibilités pour exploiter le potentiel des Data Analytics, ne serait-ce que de manière approximative.
Plus qu'un simple jonglage de chiffres
Le datascouting, c'est bien plus que de comparer des chiffres, de les traiter dans Excel, de les trier ou de les faire éclater dans un diagramme x/y.
Le DataAnalytics, c'est du football, de l'informatique et des mathématiques. Par expérience, ces dernières sont, à tort, fortement sous-estimées. Mais sans savoir-faire et sans fonctions mathématiques, il n'est pas possible d'analyser et de comparer intelligemment des montagnes de données.
Notre approche complémentaire du data scouting
Nous avons l'ambition de recruter le plus de bons joueurs possible
de trouver les meilleurs et de ne pas passer à côté des meilleurs.
Nous utilisons des fonctions mathématiques qui nous aident à comparer et à interpréter les données. Les exemples les plus connus sont la moyenne, la médiane et l'écart-type. D'autres, comme la moyenne harmonique, le sigmoïde, le Z-score et la cosine, sont un peu moins connues.
Nous analysons les données disponibles à l'aide de trois approches différentes. Nous nous assurons ainsi de pouvoir trouver des joueurs intéressants de plusieurs manières.
La NASA suit également cette approche dans le domaine spatial. Pour maximiser la sécurité en cas de panne, les équipements les plus importants doivent non seulement être installés en double, mais aussi être construits avec deux technologies différentes.
1) Value Adjustment - Ajuster les valeurs
Afin de comparer les joueurs de la manière la plus juste possible, nous ajustons les métriques quantitatives offensives et défensives avec différentes unités. Selon la métrique, par possession, par passe, par touche ou même par passe spécifique. Il s'agit de mettre en relation l'input et l'output de manière pertinente. Dans la sélection, cela génère également des joueurs d'équipes ayant moins de possession de balle et les fait briller.
Plus la corrélation entre la métrique quantitative et l'unité ajustée est forte, plus les conclusions de l'analyse des données seront solides et pertinentes.
Blog in english: Comparing players fairly
2) Profils de position et métriques clés avec filtre
Profils : Nous définissons d'abord les profils de recherche ou les positions et leurs caractéristiques: Par exemple, au milieu de terrain, un deep playmaker, un milieu de terrain progressif, un box-2-box ou un attacking midfielder. De même, un ailier large a d'autres exigences qu'un ailier inversé centré, etc. Ainsi, pour tous les postes, les différentes caractéristiques peuvent être traitées et analysées différemment.
Les métriques clés : Nous définissons ensuite les métriques clés par position et par caractéristique. Par exemple, un milieu de terrain défensif a des key metrics différentes de celles d'un milieu de terrain offensif. Et un défenseur central avec des exigences élevées en matière de progression du ballon, d'autres key metrics qu'un simple "récupérateur". Il se peut aussi que les mêmes métriques clés soient définies, mais avec des exigences différentes.
Standard deviation & z-score : nous calculons ensuite le Z-score en tenant compte de l'écart-type par joueur et par métrique clé. L'écart-type est une mesure de la dispersion (variance) des valeurs. Pour simplifier, il s'agit de la distance moyenne entre toutes les valeurs mesurées d'une caractéristique et la moyenne. Le Z-score est utilisé pour rendre les données comparables entre elles en les convertissant en une échelle standardisée (-3 à 3). Le Z-score montre où se situe exactement le joueur dans l'ensemble des performances par rapport à tous les joueurs et à la moyenne. Cela nous permet de bien identifier les valeurs aberrantes et les écarts. La valeur Z-Sore par métrique clé nous aide à fixer le niveau d'exigence du filtre à l'étape suivante.
Filtre d'exigence : nous définissons ensuite des seuils de Z-score et définissons ainsi l'exigence minimale par métrique clé. Pour certaines métriques, un joueur doit être au minimum daans la moyenne, pour d'autres au-dessus de la moyenne et pour d'autres encore exceptionnellement bon. Et cela varie naturellement pour tous les profils de rôle. C'est tout un art que d'ajuster ces filtres de manière à ce que les bons joueurs puissent les surmonter. La hauteur des obstacles est bien entendu définie individuellement pour chaque mandat de recherche. Il faut bien tarer les filtres. Si trop de joueurs passent encore le filtre, les exigences sont augmentées.
Ajustement final : à la fin, après quelques itérations et ajustements fins, on obtient l'identification définitive des joueurs les plus appropriés et les meilleurs. Sur cette liste, il y aura certainement des joueurs surprenants qui n'avaient pas été ciblés auparavant. Il y aura aussi des joueurs dont la valeur marchande est plus faible parce qu'ils ne sont pas populaires grâce à la recherche standard.
ExampleLonglist: Central Progressive Midfielder, U25, max 2Mio, Europe
Voici les meilleurs résultats (sans nom) lors d'un mandat pour un CM progressif.
Liste triée selon les meilleures performances dans sa ligue, selon le profil de recherche. Valeurs de marché de Transfermarkt
De Bruyne était tout en haut. D'autres des ligues Top 5+ ont été victimes de la valeur marchande. Néanmoins, elle contient encore d'excellents joueurs, des joueurs moins chers et des joueurs moins connus de nombreuses ligues différentes.
3) Algorithme de similitude
Les scores de similarité ont été utilisés pour la première fois dans le sport par le pionnier de la saboterie Bill James. Ses méthodes ont également été utilisées par Billy Beane au baseball chez les Oakland Athletics. Connue grâce au livre/film Moneyball (The Art of Winning an Unfair Game, by Michael Lewis).
Il s'agit d'une méthode mathématique permettant de déterminer la similitude entre deux vecteurs. En termes très simples, on compare chez les joueurs la similitude globale de la distance par rapport à la moyenne pour toutes les métriques pertinentes. Nous pouvons ainsi examiner la similitude globale des données de chaque joueur et obtenir un résultat de couverture de -1 (opposé) et 1 (identique).
Nous pouvons ainsi partir d'un joueur de référence et trouver des joueurs similaires.
Prenons l'exemple de Lionel Messi. Nous pouvons utiliser l'algorithme pour rechercher dans tous les championnats du monde des joueurs dont le profil/les caractéristiques sont les plus proches possibles.
Cela ne signifie pas que les joueurs trouvés sont aussi bons que Messi. Mais qu'ils ont les mêmes forces et faiblesses et qu'ils sont très similaires en termes de style et d'expression. Cette méthode nous permet également de trouver des joueurs intéressants, qui ne deviennent parfois encore plus intéressants qu'après un examen plus approfondi... .
Prenons comme exemple pratique le vainqueur de la Ligue des champions Kevin de Bruyne de Manchester City. Il présente des valeurs exceptionnelles dans différentes dimensions. Si nous lui appliquons l'algorithme, nous trouvons Iliass Bel Hassani du RKC Waalwik en Eredivisie, avec une similitude de 93,21%. D'ailleurs, son contrat expire le 31 mai 2023 ;-)
Comparaison directe des profils.
Bel Hassani a malheureusement déjà trente ans et le meilleur âge pour le scouting. Mais cela devient passionnant lorsque nous appliquons l'algorithme à des joueurs plus jeunes.
Ainsi, nous trouvons entre autres Matt O'Riley (22 ans) du Celtic Glasgow avec une ressemblance de 84,8%. Bien sûr, dans une ligue avec une force différente, mais un jeune joueur en développement avec un profil de force similaire à Kevin De Bruyne.
Bien sûr, nous trouvons également de jeunes joueurs de la Super League, de la Bundesliga, de la Bundesliga autrichienne et de toutes les autres ligues. Que ce soit De Bruyne, Messi, Kimmich, Barella, Grealish, Pedri, Haaland, Neymar, Osimhen, Kim Min-jae and Co. Avec des mathématiques intelligentes, vous pouvez identifier des joueurs talentueux et jeunes avec des profils similaires aux superstars. Les possibilités sont vastes. On pourrait également citer l'équipe clone U23 de Manchester City comme exemple. Également dédié à une ligue ou une région. Le data scouting n'est pas une science exacte. Il n'y a pas de voie dorée. Mais plus vous abordez le sujet et en apprenez plus, plus les possibilités et solutions complémentaires s'offrent à vous.
J'encourage tous les clubs et agences à investir non seulement dans les outils, mais aussi dans les personnes et le savoir-faire analytique. Sinon, ils restent un dans la foule. Commencez un voyage d'apprentissage et recueillez vos propres expériences. C'est le seul moyen de capter le potentiel d'utilisation des données et, si possible, de l'exploiter.
126 million profit in 2 years with data driven scouting
In April 2022, we scouted eleven U21 players with our data driven algorithm. In two years, as of April 2024, 8 million market value has become 134 million (+126), forget Bitcoin :-)
Here to the article with original and current market values: footballytics U21 (data) Dreamteam
Voici notre datascouting service
Nous ne pouvons pas nous empêcher de terminer par une citation d'un mathématicien.
"Donnez-moi un point fixe et je bouleverserai la terre." Archimède
footballytics – nous savons comment faire parler les données Nous soutenons les clubs, les entraîneurs, les agences et les joueurs avec des services d'analyse et de conseil dans l'utilisation et l'interprétation des données. Pour prendre de meilleures décisions dans le dépistage, l'analyse du jeu et sur le terrain.
www.footballytics.ch Share this post
Comments