top of page
  • Autorenbildfootballytics

Moneyball: Mit smartem Datenscouting Potential ausschöpfen


pic by Thomas T  & Dall-E
pic by Thomas T & Dall-E


Ja, unser Algorithmus hätte Kaoru Mitoma im 2020 bei Kawasaki Frontale in der J1 League schon gefunden


Wenn man etwas nicht gut kennt oder es auch nicht intensiv ausprobiert hat, ist es schwierig, das volle Potential abzuschätzen. Wir zeigen in diesen Blog, wie wir mit unserem Ansatz und verschiedenen Methoden und mathematischen Funktionen, ein smartes und komplementäres Datenscouting anwenden, um möglichst das volle Potential auszuschöpfen.


Unsere Mühen in der Schule haben sich nun doch endlich gelohnt. Mathematik kann auch verwendet werden, um Spieler zu vergleichen und zu scouten. Das ist doch bisher wirklich eine der besten Anwendungsbereiche :-)



Datenscouting ist Spieler Identifikation und nicht Selektion

Das Datenscouting hat nicht zum Ziel, den einen besten Spieler finden zu wollen, sondern viele gute und passende Spieler. Die Profile von ganz ganz vielen Spielern werden analysiert, um die unpassenden auszusortieren. Je detaillierter das Suchprofil, desto besser der Filter und das Resultat.





Es ist mit Daten nicht möglich und auch nicht sinnvoll, den besten Spieler finden zu wollen. Daten helfen, um von den abertausenden Spielern geeignete Spieler zu identifizieren, die ins Suchprofil passen (Pre-Scouting). Die besten aus den Kandidaten zu bestimmen, ist und bleibt Aufgabe der Scouts mit ihrer Expertise und Erfahrung.



Datenscouting analysiert ganze Fussballwelt mit einem Klick

Wie lange brauchen Sie, um bei einem Spieler grob abzuschätzen, ob er in Ihr Suchprofil passt oder nicht? Fünf Minuten oder Zehn? Bei Zehn Minuten brauchen Sie für 100 Spieler rund 16 Stunden. Ein Algorithmus kann dies bei 100'000 Spieler in einer Minute erledigen. Zudem findet man mit den Daten überraschende und günstigere Spieler, da die Nachfrage ausserhalb der Massen-Standardsuche geringer ist. Datenscouting garantiert, dass nicht zu schnell auf einzelne oder empfohlene Spieler fokussiert wird, sondern das ganze Spektrum durchsucht wird. Auch dort, wo man nichts zu finden vermutet.


Rein statistisch kann man aufgrund der Menge und der Varianz sagen, dass wirklich in jeder Liga ein Jahrzehntetalent zu finden ist.


Datenscouting reduziert Abhängigkeiten von Beratern

Es gibt noch viel zu viele Vereine, die ein grösstenteils reaktives Scouting betreiben. Sie bekommen von den Agenten täglich mehrere Spieler angeboten und die Scouts müssen viel Aufwand für eine Schnelleinschätzung und grösstenteils auch eine Absage aufwenden. Viel Aufwand für Spieler, an denen sie gar nicht interessiert sind.


Mit diesem reaktiven Vorgehen sind die Vereine schon viel zu früh auf eine kleine Anzahl Spieler fokussiert. Sie fischen sozusagen nur in den Teichen der Agenten/Berater und im Interesse derer. Nutzt man allerdings Daten für die Identifikation von passenden Spielern, kann man das Spiel kehren und in den Weltmeeren fischen. Und danach bei Bedarf auf die entsprechenden Berater zugehen. Change the game.




Datenscouting Prozess

Der ideale Scoutingprozess beginnt mit Datenscouting (Pre-Scouting)

Alle Profile aller verfügbaren Spielern werden analysiert. Der Output ist eine Kandidatenliste mit 30-100 Spielern. Danach werden die Kandidaten von den Scouts mittels Video- und Livescouting weiter bewertet.








Maturitäten bei der Nutzung von Daten im Scouting

Aus den Erfahrungen und Gesprächen mit nationalen und internationalen Vereinen, können wir die Vereine beim Nutzen von Daten in folgende Maturitätslevel einteilen.


  • User: Scouts nutzen Daten in Tools von professionellen Anbietern. Spieler-Statistiken und Metriken werden so auf einfache Weise standardisiert verglichen. Reaktives Scouting nach Empfehlungen von Beratern/Agenten.

  • Individual: Keine eigene Analytics Ressourcen. Bestehende Scouting Ressourcen werden zusätzlich mit Analyseaufgaben beauftragt. Daten werden aus den Tools exportiert und in Drittapplikationen wie Excel, Tableau, Power-Bi zusätzlich nach vereinsspezifischen Bedürfnissen analysiert. Entwickeln eigene vereinsspezifische KPI's. Mix zwischen reaktivem und präventivem Scouting. Oft keinen durchgängigen Datenprozess im Scouting implementiert.

  • Analyst: Vereine verfügen über dedizierte Analysten Ressourcen, die mit den Scouts zusammenarbeiten. Wenden im Datenscouting fortgeschrittene KPI's, Logiken, Algorithmen und mathematische Funktionen an. Datenscouting und datengestützte Entscheidungen sind über alle Stakeholder im Scouting und ggf. in der Spielanalyse etabliert.

  • Analyst Teams: Verfügen über ganze Teams von Analysten, DataScientists und Mathematikern. Verfolgen einen wissenschaftlichen Ansatz und entwickeln eigene Methoden und Logiken zur Analyse der Daten. Datenkultur ist über den ganzen Verein etabliert.

Nichts gehen die Nutzung von standardisierten Tools. Diese sind sehr günstig und sehr gut. Aber um das Potential der Analytik zu erkennen und auszuschöpfen, braucht es auch Investitionen in Menschen, eigene Ressourcen und Knowhow.

Jeder Verein sollte sich überlegen, ob er das Potential nicht selber erkunden möchte. Im Moment suchen Vereine fast täglich Datenanalysten, zum Aufbau oder zur Verstärkung ihrer Analyse Abteilung.


Neue Technologien haben immer auch das Potential, Systeme zu transformieren, Machtverhältnisse zu verschieben und die Anforderungen an die Führungspositionen zu verändern.

Die Datenanalyse sagt uns, dass der entsprechende Spieler zum Suchprofil passt und gute Leistungen erbracht hat. Aber die Daten sind nur eine spezifische Sicht. Wie ein zusätzliches Auge bzw. eine zusätzliche Perspektive. Sie ist wie jede andere Perspektive nicht die einzige Wahrheit. Es wäre aber töricht, für wichtige Entscheidungen diese Perspektive zu verschmähen.

Die Sicht auf die Daten ist in jedem Falle ein Mehrwert. Entweder bestätigt sie die eigene Wahrnehmung, oder sie zwingt uns genauer hinzusehen.

Alle Vereine nutzen Daten, um Spieler zu vergleichen und zu scouten. Aber nur wenige Vereine schöpfen wirklich das ganze Potential aus.

Damit Scouting nachhaltig und systematisch erfolgreich sein kann, müssen verschiedene Menschen und Gruppen gut zusammenarbeiten und es müssen einige positiven Dinge zusammenkommen. Anders formuliert:


In den Bereichen Wissen, Können, Kommunikation, Prozess und Führung gibt es unheimlich viele Möglichkeiten, um das Data Analytics Potential nicht nur annähernd auszuschöpfen

Mehr als nur mit Zahlen jonglieren

Datascouting ist viel mehr, als Zahlen zu vergleichen, im Excel zu bearbeiten, zu sortieren oder diese in ein x/y Diagramm zu knallen.

DataAnalytics besteht aus Fussball, ComputerScience und Mathematik. Aus Erfahrung wird letzteres fälschlicherweise stark unterbewertet. Aber ohne mathematisches Knowhow und Funktionen ist es nicht möglich, Datenberge intelligent zu analysieren und zu vergleichen.


Unser komplementärer Datenscouting Ansatz

Wir haben den Anspruch, möglichst viele gute Spieler zu finden und die allerbesten nicht zu verpassen.

Wir nutzen mathematische Funktionen, die uns beim Vergleich und der Interpretation der Daten unterstützen. Als Beispiele sind Durchschnitt, Median und die Standardabweichung wohl die bekannteren. Während andere wie Harmonisches Mittel, Sigmoid, Z Score und Cosine wohl etwas weniger bekannt sind.


Die verfügbaren Daten analysieren wir mit drei verschiedenen Ansätzen. So stellen wir sicher, dass wir interessante Spieler auf mehrere Arten finden können.


Auch in der Raumfahrt verfolgt die NASA diesen Ansatz. Um die Ausfall-Sicherheit zu maximieren, müssen die aller wichtigsten Geräte nicht nur doppelt eingebaut sein, sondern auch mit zwei verschiedenen Technologien gebaut worden sein.



1) Value Adjustment - Werte bereinigen

Um Spieler möglichst fair zu vergleichen, bereinigen (adjusten) wir die quantitativen offensiven und defensiven Metriken mit verschiedenen Einheiten. Je nach Metrik pro pro Ballbesitz, pro Pass, pro Touch oder sogar per spezifischen Pass. Es geht darum, den Input mit dem Output in sinnvolle Relation zu bringen. Dies generiert in der Selektion auch Spieler von Teams, mit weniger Ballbesitz und lässt sie scheinen.


Je stärker die Korrelation zwischen der quantitativen Metrik und der Adjusted-Einheit ist, desto belastbarer und aussagekräftiger wird die Aussage der Datenanalyse.

Einen detaillierteren Artikel dazu gibt es hier Spieler fair vergleichen




2) Positions-Profile und Key-Metriken mit Filter


  • Profile: Zuerst definieren wir die Such-Profile bzw. Positionen und deren Ausprägungen: Als Beispiel im Mittelfeld einen Deep Playmaker, Progressiven Mittelfeldspieler, einen Box-2-Box oder Attacking Midfielder. Auch hat ein breiter Flügelspieler andere Anforderungen, als ein zentrierter inverser Flügelspieler usw. So können bei allen Positionen verschiedene Ausprägungen unterschiedlich behandelt und analysiert werden

  • Key-Metriken: Danach definieren wir die Key Metriken pro Position und Ausprägung. Zum Beispiel hat ein defensiver Mittelfeldspieler andere Key Metriken, als ein offensiver Mittelfeldspieler. Und ein Innenverteidiger mit hohen Anforderungen an Ball-Progression, andere Key Metriken als ein reiner "Abräumer". Es kann aber auch sein, dass gleiche Key-Metriken definiert sind, aber mit verschieden hohen Anforderungen

  • Standardabweichung & Z-Score: Danach kalkulieren wir mit Einbezug der Standardabweichung pro Spieler und Key Metrik den Z-Score. Die Standardabweichung ist ein Mass für die Streubreite (Varianz) der Werte. Vereinfacht gesagt, die durchschnittliche Entfernung aller gemessenen Ausprägungen eines Merkmals vom Durchschnitt. Der Z-Score wird verwendet, um Daten miteinander vergleichbar zu machen, indem man sie in eine standardisierte Skala (-3 bis 3) umwandelt. Der Z Score zeigt auf, wo genau der Spieler im ganzen Leistungsspektrum in Vergleich zu allen Spielern und dem Durchschnitt liegt. So können wir Ausreisser und Abstände gut identifizieren. Der Z-Sore Wert pro Key-Metrik hilft uns, im folgenden Schritt die Höhe der Anforderung an den Filter zu stellen.



  • Anforderungs-Filter: Danach definieren wir Z-Score Schwellwerte und definieren so die Mindestanforderung pro Key-Metrik. Bei gewissen Metriken muss ein Spieler im Minimum durchschnittlich, bei gewissen überdurchschnittlich und bei gewissen ausserordentlich gut sein. Und dies natürliche bei allen Rollenprofilen unterschiedlich. Es ist eine Kunst, diese Filter so zu tunen, dass die richtigen Spieler ihn überwinden können. Die Höhe der Hürden wird selbstverständlich vereinsindividuell pro Suchmandat definiert. Die Filter gilt es gut zu tarieren. Passieren noch zu viele Spieler den Filter, werden die Anforderungen erhöht.

  • Feinjustierung: Am Ende, nach einigen Iterationen und Feinjustierungen, steht dann die definitive Spieleridentifikation mit den passendsten und besten Spielern. Auf dieser Liste werden sicherlich auch überraschende Spieler auftauchen, die man vorher nicht im Fokus hatte. Zudem auch Spieler, die einen tieferen Marktwert aufweisen, weil sie nicht durch die Standardsuche populär sind.



Beispiel Longlist: Central Progressive Midfielder, U25, max 2Mio, Europe




Hier die Top-Resultate (ohne Namen) bei einem Mandat für einen Progressiven CM

Liste sortiert nach besten Leistungen in seiner Liga, gemäss Suchprofil. Marktwerte von Transfermarkt


De Bruyne war ganz oben. Andere aus den Top 5+ Ligen fielen dem Marktwert zum Opfer. Trotzdem sind darin noch ausgezeichnete, günstige und unbekanntere Spieler aus vielen verschiedenen Ligen enthalten.





3) Ählichkeits-Algorythmus

Similarity Scores hat im Sport erstmals der Sabermetric Pionier Bill James angewandt. Seine Methoden wurden auch von Billy Beane im Baseball bei den Oakland Athletics genutzt. Bekannt aus dem Buch/Film Moneyball (The Art of Winning an Unfair Game, by Michael Lewis)


Es handelt sich um eine mathematische Methode, um die Ähnlichkeit zwischen zwei Vektoren zu bestimmen. Sehr vereinfacht ausgedrückt, wird bei den Spielern die Gesamt-Ähnlichkeit der Distanz zum Durchschnitt bei allen relevanten Metriken verglichen. Damit können wir die Datensätze der einzelnen Spieler auf Gesamt-Ähnlichkeit untersuchen und erhalten als Resultat eine Deckung von -1 (entgegengesetzt) und 1 (identisch) .


Wir können damit von einem Benchmark Spieler ausgehen und ähnliche Spieler finden. Nehmen wir zum Beispiel Lionel Messi. Wir können wir mit dem Algorithmus in allen Ligen dieser Welt nach Spielern suchen, die ein möglichst ähnliches Profil/Ausprägung haben.


Das bedeutet nicht, dass die gefundenen Spieler gleich gut wie Messi sind. Aber, dass sie gleiche Stärken und Schwächen aufweisen und vom Stil und der Ausprägung sehr ähnlich sind. Auch mit dieser Methode finden wir interessante Spieler, die manchmal erst bei der genaueren Betrachtung noch interessanter werden.. .


Als Praxis Beispiel nehmen wir den Champions League Sieger Kevin de Bruyne von Manchester City. Er weist herausragende Werte in verschiedenen Dimensionen auf. Wenn wir den Algorithmus auf ihn anwenden finden wir Iliass Bel Hassani vom RKC Waalwik in der Eredivisie, mit einer Ähnlichkeit von 93.21%. Am 31 Mai 2023 läuft übrigens sein Vertrag aus ;-)


Profile im Direktvergleich.

Bel Hassani ist leider schon dreissig und aus dem besten Scouting Alter. Spannend wird es aber dann, wenn wir den Algorithmus auf jüngere Spieler anwenden.


So finden wir unter anderem Matt O’Riley (22) von Celtic Glasgow mit einer Ähnlichkeit von 84.8%. Natürlich in einer Liga mit einer anderen Ligastärke, aber ein junger entwicklungsfähiger Spieler mit einem ähnlichen Stärken-Profil wie Kevin De Bruyne.


Natürlich finden wir so, auch junge Spieler aus der Super League, Bundesliga, Austria Bundesliga und jeder anderen Liga.


Ob De Bruyne, Messi, Kimmich, Barella, Grealish, Pedri, Haaland, Neymar, Osimhen, Kim Min-jae und Co. Mit smarter Mathematik ist man in der Lage, talentierte und junge Spieler mit ähnlichen Profilen der Superstars zu identifizieren.


Die Möglichkeiten sind extensiv. Man könnte als Beispiel auch das U23 Klon-Team von Manchester City bestimmen. Auch dediziert in einer Liga oder Region.


Datascouting ist keine exakte Wissenschaft. Es gibt nicht den einen goldenen Weg. Aber je mehr man sich mit dem Thema auseinandersetzt und dazulernt, desto mehr sich ergänzende Möglichkeiten und Lösungen stehen einem zur Verfügung.


Ich ermutige alle Vereine und Agenturen, nicht nur in Tools, sondern auch in Menschen und Analytics Knowhow zu investieren. Sonst bleiben sie einer in der Masse. Startet eine Lernreise und sammelt eigene Erfahrungen. Nur so, kann man das Potential der Datennutzung erfassen und möglichst auch ausschöpfen.

Hier unser Datenscouting on demand Angebot zur Unterstützung oder als Benchmark für ihr eigenes Scouting


Daten und Video sind komplementär. Gemeinsam nutzen sie uns, unser Verständnis für das Spiel und die Spieler zu schärfen. Ohne Videos entgehen uns Informationen. Ohne Daten entgehen uns Informationen. Die Frage lautet nicht „Soll ich Daten verwenden oder soll ich mir ein paar Spiele ansehen?“, sondern vielmehr „Wie viele Daten sollte ich für diese Analyse verwenden und wie viele Videos?“



Beispiel Usecases aus dem letzten Mandat von Juni 2023


  • Spieler Assessment optimieren Signifikante Zeiteinsparung durch qualitative und datengestützte Ersteinschätzung der angebotenen Spieler.

  • Pre-Scouting mit Daten Suchalgorithmus nach Spielphilosophie entwickelt und Erstselektion (Longlist) für diverse Positionen als Startpunkt für Scouting Department produziert.




Wir können nicht anders, als mit einen Zitat eines Mathematikers zu schliessen.


"Gib mir einen festen Punkt, und ich hebe die Erde aus den Angeln." Archimedes

Aufgrund verschiedener Datascouting & Analyse Mandate werden wir mit Blog Beiträgen eine Sommerpause einlegen.



Hat Dir die Qualität unseres Beitrags gefallen? Dann belohne uns mit Deinen "Credits" und like und teile diesem Beitrag innerhalb Deines sozialen Netzwerkes. Besten Dank.

Um keinen Beitrag zu verpassen kannst Du den Blog abonnieren.


footballytics – we know how to make the data talk

Wir unterstützen Vereine, Trainer, Agenturen und Spieler mit Analyse- und Beratungsdienstleitungen beim Nutzen und Interpretieren von Daten. Um im Scouting, in der Spielanalyse und auf dem Spielfeld die besseren Entscheidungen zu treffen.

 

Blog von www.footballytics.ch Über Data Analytics Themen im Fussball - improve the game - change the ǝɯɐƃ

Teilen Sie diesen Beitrag

bottom of page