Wir zeigen in diesem Blog, wie man einen Index baut. Dabei entwickeln wir als Praxisbeispiel einen Aussenverteidiger Offensiv Index und können daraus die offensivsten Aussenverteidiger und Teams in Europa identifizieren. Auch können wir mit diesem Muster talentierte Trainer finden, da das "Wie" der Aussenverteidiger nach vorne kommt, auch viel von den Ideen und Strategien des Trainers abhängt.
Ein Index beantwortet eine Frage, mit einem Score zwischen 0 und 100
Ein Index ist ein Maas für die Gesamtleistung, das durch eine gewichtete Kombination verschiedener Faktoren berechnet wird. Das Resultat ist eine Zahl die die Gesamtleistung widerspiegelt. Einerseits ist es reizvoll die Gesamtleistung in einer einzigen Zahl zu packen, andererseits ist es auch eine Herausforderung den Index wirklich aussagekräftig zu gestalten.
Daten erfolgreich nutzen ist weit mehr als Tools nutzen. Diese sind zwar gut, aber eben für die Masse gestaltet. Eigene Indizes sind individuell und massgeschneidert für jedes Team, jede Agentur oder jeden Spieler.
Es geht mir in diesem Artikel nicht nur um die Erkenntnisse, sondern auch darum, die Methode aufzuzeigen. Wie man einen individuellen Index entwickelt und die Werte vergleichbar macht. Der effektive Mehrwert entsteht wie immer durch eine gute Idee und weniger durch die Methode. Die braucht es aber, um der Idee Kraft zu verleihen.
Unterdessen datenscouten wir für Vereine in verschiedenen Ligen Europas. Alle Vereine nutzen unterdessen Daten, um Spieler zu vergleichen und zu scouten. Aber nur wenige Vereine schöpfen bezüglich Knowhow, Fähigkeiten und Prozess das ganze Potential aus.
Der Blog ist am Ende wohl etwas lang geraten. Aber es ist schwierig, wenn die Passion zu einem Thema immer wieder Resonanz erzeugt ;-)
Aussenverteidiger - Fullback
Die Rolle und Ansprüche an den Aussenverteidigers hat sich in den letzten Jahren massiv verändert. Vorbei ist die Zeit der reinen Zerstörer.
Der Aussenverteidiger ist so eine Art all-in-one Position.
Die Anforderungen an Technik, Dribbling, langen Sprints und guten Pässen, ja sogar Vorlagen und Torabschlüssen haben stark zugenommen. Kein Wunder werden immer mehr Mittelfeldspieler mit guten Füssen zu Aussenverteidigern "umfunktioniert". Mittelfeldspieler mit durchschnittlichen offensiven Werten und und guten defensive Werten, sind prädestiniert dafür zum Aussenverteidiger umfunktioniert zu werden.
Zuerst solider Verteidiger, wenn es hinten von Nöten ist, unterstützt er später als Mittelfeldspieler den Spielaufbau. Und wenn der Ball dann im letzten Drittel ankommt, hat er sich auf intelligente Art bereits ein paar Meter nach vorne gestohlen. Wie in Baseball die Base gestohlen... Dies garantiert ihm im Spiel im letzten Drittel eine kurze Distanz zur Offensive und erlaubt ihm als zusätzlicher Angreifer Überzahl zu schaffen und den Unterschied in der Offensive auszumachen.
Der Aussenverteidiger ist wie der Bauer im Schach. Er kann decken, die Kette schützen, nach vorne verteidigen, sich nach vorne stehlen und sich dann im Angriff in die mächtige Dame verwandeln.
Eine oft unterschätzte Eigenschaft eines Aussenverteidigers ist das Lesen des Spiels. Ist er nicht in der Lage das Risiko eines Ballverlustes richtig einzuschätzen und sich frühzeitig nach vorne zu bringen, bleibt er zu weit vom Tor weg. Die Eigenschaft frühzeitig Meter zu gewinnen und der Aktion Voraus zu sein, ist das Fundament für die Offensivaktionen des Aussenverteidigers.
Eine gute Wahrnehmung schafft Zeitvorsprung. Im Fussball ist eine Sekunde Vorsprung eine Welt.
Die Methode: Wie baue ich einen Index?
Indizes zeigen die Gesamtleistung auf, die aus verschieden Teilleistungen besteht. Sie bieten eine zusammenfassende Bewertung, die auf mehreren Faktoren basiert. Dies ermöglicht eine einfache und klare Bewertung in Bezug auf die Gesamtleistung.
Um einen Index zu bauen sind folgende Schritte notwendig
Auswahl von Bestandteilen/Metriken:
Wichtigste sich möglichst abgrenzende aber relevante Metriken auswählen. Es ist darauf zu achten, dass eine Eigenschaft nicht zu stark oder doppelt durch ähnliche Metriken überbewertet wird. Ganzes Spektrum an Eigenschaften abbilden.
Z-Scores für jede Metrik berechnen:
Mit Z-Scores, auch Standard-Scores genannt, können wir Datenpunkte in Bezug auf den Mittelwert und die Standardabweichung eines bestimmten Datensatzes vergleichen und analysieren. Durch die Umwandlung von Rohwerten in Z-Scores können wir Ausreisser leichter identifizieren, Z-Scores ermöglichen uns auch den Vergleich von Variablen mit unterschiedlichen Massstäben und Masseinheiten. So kann ich Anzahl Schüsse (Volumen) und gewonnene Duelle in % (Qualität) vergleichbar machen. Formel (x-Mittelwert)/Standardabweichung
Gewichtung der Bestandteile/Metriken:
Entscheide wie die einzelnen Werte im Index gewichtet werden sollen. Dies kann auf Basis von Mittelwerten, harmonisches Mittel oder auch individuell pro Metrik erfolgen. Im Datenscouting gewichten wir die Metriken für jeden Verein individuell, nach den Anforderungen an die Position und den Spieler. Der detaillierte Artikel dazu: Moneyball Datenscouting
Score - Normalisierung der Indexwerte:
Normalisierung in Index Werte (effektiver Score) auf 0-100 Skala Formel: (x-min)/(max-min). Im Bereich von 0 bis 100 fühlen wir uns wohl.
Praxis-Beispiel: Aussenverteidiger Offensiv Index
Wie bei allem, was ich im Fussball interessant finde, versuche ich herauszufinden, wie wir mithilfe von Daten die Spieler und Mannschaften finden können, die ihre Aussenverteidiger systematisch nach vorne bringen.
Um den offensiven Output der Aussenverteidiger zu messen, entscheide mich, mich folgende Metriken in den AV Offensiv Index zu integrieren:
Deep Completion - Successful non-cross pass targeted 20m within of opponent's goal. Shot Assist - The last action of a player prior to a teammate having a shot
Shot - An attempt towards the opposition's goal with the intention of scoring.
Progressive run - A continuous ball control by one player attempting to draw the team significantly closer to the opponent goal.
Das sind alles Aktionen die den Ball näher zum Tor bringen oder direkt/indirekt für Torgefahr sorgen. Ich verzichte auf Tore oder Asssist bzw Expected Goals (xG) und Expected Assists (xA), da diese zu selten und zu volatil sind. Auch auf Flanken habe ich verzichtet, da meine Angriffs-Präferenz pass- und nicht flankenorientiert ist.
Wichtig: Bei einem ausgewogenen Datenscouting würden wir natürlich auch defensive Metriken berücksichtigen. In diesem Experiment geht es uns "nur" um den offensiven Teil, da wir Spieler, Teams und Trainer finden wollen, bei denen genau diese Eigenschaft ausgeprägt ist.
Daten - Dataset
Ich verwende Wyscout Daten der Saison 23-24 mit Stand 3.Januar 2024.
Ich beschränke mich auf Ligen in Europa und Spieler mit mindestens 700 Spielminuten.
Zudem nehme ich nur Spieler die am meisten als Left- (LB) oder Rightback (RB) eingesetzt wurden. Flügelverteidiger/Wingbacks (LWB/RWB) schliesse ich wegen der Vergleichbarkeit aus. Damit bleiben nur Aussenverteidiger von Teams die in einer Viererkette agieren. Vierer- und Dreierkette Teams miteinander zu vergleichen, wäre nicht fair. Schlussendlich ergibt sich ein umfangreiches Dataset mit 59 Ligen, 903 Teams und rund 2'2'00 Spielern.
Datenbereinigung
Ein grosser Anteil der Arbeit des DataAnalysten ist das Bereinigen von Daten. Diese wichtige Tätigkeit benötigt oft mehr Zeit als die effektive Analyse. Als Tool verwende ich Excel.
Mir stehen die Deep completions, Shot assists, Shots und Progressive runs Werte schon per 90 Minuten bereinigt zur Verfügung. Ich ziehe jetzt den Team-Ballbesitz hinzu, um die Werte zu bereinigen. Teams mit mehr Ballbesitz haben mehr Zeit, um offensive Aktionen zu tätigen. Damit die Werte fair verglichen werden können, ist diese Bereinigung auf 50% Ballbesitz notwendig. Formel: Value/Team-Ballbesitz * 50 Die Werte lable ich nun mit pAdj (Possession adjusted)
Siehe Artikel Analytics Praxis: Spieler fair vergleichen
Aussenverteidiger Offensiv Index
Um die verschiedenen Metriken und deren Werte vergleichbar zu machen müssen wir diese manipulieren. Wir müssen dies tun, damit wir diese verschiedenen Variablen vergleichen, gegenüberstellen, kombinieren usw. können.
Z-Score Kalkulation Dazu wandle ich jeden Wert der Metrik in einen Z-Score um. Die Formal lautet (x-Mittelwert)/Standardabweichung. Z-Scores sind praktisch eine numerische Darstellung der Position einer Zahl in der Verteilung dieser Metrik in Standardabweichungen. Dadurch werden die Werte, Abstände und auch quantitative und qualitative Werte untereinander vergleichbar
Ein Z-Score wird als die Anzahl der Standardabweichungen vom Mittelwert beschrieben. Ein im Z-Score vorhandener Datenpunkt ist die Berechnung, wie viele Standardabweichungen über oder unter dem Mittelwert liegen. Ein Standardwert ist ein Rohwert wie der Z-Score und liegt auf einer Normalverteilungskurve. Z-Scores sind die Werte, die zwischen -3 und +3 Standardabweichungen liegen können. Im folgenden eine grafische Darstellung. Die Werte liegen grösstenteils im Bereich von -3 bis 3. Seltene und extreme Ausreisser können aber auch einiges höher liegen.
Gewichtung Bei der Gewichtung der Metriken entscheide ich mich für Shots 35%, Shot Assist 30%, Deep Completions 25% und Progressive runs 10%. Zusätzlich aggregiere ich aus den Spielerwerten den Mittelwert pro Team als Team Index, der uns eine Sicht auf Mannschaftsebene und auch auf Ligaebene erlaubt.
Normalisierung 0-100 Score
Schlussendlich normalisieren wir die Indexwerte mit der Skala von 0-100. Ich normalisiere alle Ergebnisse, sodass die höchste Punktzahl 100 und die niedrigste Punktzahl 0 beträgt. Es ist damit viel einfacher, Teams zu vergleichen. Formel (x-min)/(max-min)*100.
Dadurch bleibt die Verteilung der nicht normalisierten Ergebnisse erhalten und der relative Abstand zwischen zwei Teams bleibt gleich, aber es ist viel einfacher zu interpretieren.
Die Arbeit ist getan, jetzt sind wir gespannt auf die Resultate.
Resultate auf Spielerebene
Es folgen die Spieler mit den höchsten Aussenverteidiger Offensiv Index Werten. Also alles Aussenverteidiger die mit Läufen und Pässen, Schussvorlagen oder Schüssen für Torgefahr sorgen. Schüsse abgeben bedeutet auch in die Box zu kommen. Ich erinnere daran, dass keine Flügelverteidiger/Wingbacks mit Hauptposition RWB/LWB darin enthalten sind. Der Spieler mit dem höchsten Wert bekommt eine 100.
Spieler Top 30 über alle Ligen
Bestenliste aus rund 2'200 Spielern. Wingbacks ausgeschlossen.
Arlind Ibrahim Rexhepi (20) vom HSV II erzielt als AV die besten Werte in ganz Europa .
Die höchsten Scores der reinen RB/FB haben P. Mares, P. Heise und Y. Sugawara..
Interpretation: Es ist auffallend, dass viele der best gerankten Spieler neben Left- und Rightback LB/RB auch offensivere Positionen gespielt haben, wie zum Beispiel Wingback oder Flügel. Dies führt natürlich dazu, dass ihre Werte erhöht und die Aussagen etwas relativiert werden. Trotzdem hat jeder dieser Spieler die meiste Einsatzzeit als RB/LB gespielt. Der Score von reinen RB/LB ist demzufolge höher zu bewerten, die sie im Spielaufbau positionsbedingt tiefer starten. Dies gilt für alle Resultate.
Spieler Top 30 DACH Ligen
Die höchsten Scores der reinen RB/FB haben P. Heise, T. Handwerker und M. Frydek. ..
Das Wissen über ein Ranking ist nicht nur für die Scouts, sondern auch für die Spieler wertvoll. Sie können so ihr Ranking bestimmen, ihren Wert begründen, Benchmarks bestimmen und auch Entwicklungsschwerpunkte definieren und monitoren.
Spieler Top 30 Top 6 Ligen
Die höchsten Scores der reinen RB/FB haben Trent Alexander-Arnold, L. Paqarada und G Suazo.
Unten die Attacking Key Action von Rodrigo Riquelme von Atlético Madrid. Auffallend sind die vielen Cutbacks. Artikel zur modernen Angriffswaffe: Bundesliga: Mit Cutbacks die Abwehr knacken
Detailartikel zu modernen "Angriffswaffe": Trend: Mit Cutbacks die Abwehr knacken
Spieler Top 30 tier2 Ligen
Die höchsten Scores der reinen RB/FB haben P. Heise, T. Handwerker und A.Hiim.
..
Resultate auf Teamebene
Es folgen die Teams mit den höchsten Aussenverteidiger Offensiv Index Werten.
Dabei berücksichten wir nur Teams, bei denen mindestens zwei Aussenverteidiger mehr als 700 Spielminuten aufweisen.
Teams Top 30 alle Ligen
Bestenliste aus rund 900 Teams mit mindestens zwei Aussenverteidigern mit mehr als 700 Spielminuten. Score normalisiert mit bestem Team 100,
A. Rexhepi und N. Oliveira vom Hamburger SV II erreichen zusammen die höchsten offensiven Werte. Es sind auffallend viele Teams aus Skandinavien vorne dabei, was in der Summe sicherlich eine Ligaweite Tendenz ist.
Teams Top 30 DACH Ligen
Teams Top 30 Top 6 Ligen
Teams Top 30 tier2 Ligen
Resultate auf Ligaebene
Es folgen die Ligen mit den höchsten Aussenverteidiger Offensiv Index Werten. Die Werte wurde neu anhand der besten Liga (100) skaliert. Teams mit Dreierkette und Wingbacks nicht darin enthalten. Bestenliste aus rund 60 Ligen. Die offensivsten Aussenverteidiger sind in der zweiten Liga Norwegens zu finden und danach in der 2. Bundesliga.
Trainer Scouting
Wie gesagt, hängt auch viel vom Trainer ab, ob und wie er seine Aussenverteidiger viel und oft nach vorne bringt. Demzufolge ist dieser Index auch für die Trainer ein Prädikat. Aus den Daten kann man das Wieviel? herauslesen, aber nicht das Wie?
Um den Kontext zu bilden und zu verstehen welche Idee oder welches Konzept dahintersteht, muss man die Spiele analysieren. Es folgt eine Liste der Trainer, die einen hohen Aussenverteidiger Offensiv Index erreichen. Diese Trainer müssen nicht zwingend erfolgreich sein, sollten aber interessante Ansätze verfolgen um ihre Aussenverteidiger im Spielaufbau systematisch nach vorne zu bringen. Eine Videoanalyse ist zu empfehlen.
Während meiner Tätigkeit als Spielanalyst in der Super League hatten die Aussenverteidiger eine wichtige Rolle. Einerseits offensiv im Spiel nach vorne. Aber auch mit richtigem Positionsspiel in der defensiven Transition. Zudem legte ich grossen Wert darauf, dass die Aussenverteidiger die Situation gut lesen konnten. Dadurch konnten sie mit möglichst wenig Risiko, etwas spekulieren und den Weg nach vorne antizipativ verkürzen. Intern habe ich das mit "Base stehlen" verglichen. Auch bei Verlagerungen helfen smarte taktische Ansätze, um dem gegnerischen Team weniger Zeit fürs Verschieben zu geben.
Bestenliste aus rund 900 Trainer
*ab Platz 10 nur tier1 Teams/Coaches
Beispiel 2: Einen Index in 30 Minuten - Top die Wette gilt
Das Potential und die Anwendungsmöglichkeiten für Indizes sind sehr gross. Hier als weiteres Praxisbeispiel ein vereinfachtes Schnell-Experiment: Ich suche Teams von Trainern mit viel Ballbesitz, hohem Pressing und einer soliden Defensive. Dafür verwende ich Werte Ballbesitz %, PPDA (Durchschnittliche gegnerische Anzahl Pässe vor Defensivaktion) und Shot against per 90,
Ich bilde die Z-Scores. Bei PPDA muss ich die Z-Score Formel noch anpassen, da tiefe unnd nicht hohe Werte erwünscht sind. Dann berechne ich den Mittelwert aller Z-Scores und Normalisiere auf die 100er Skala. Fertig. Diesen Index könnte ich auf alle Ligen der Welt anwenden, um spannende Teams oder Trainer zu finden. Ich definiere was ich suche und der Indexwert zeigt mir, stark das korreliert. Hier das Resultat, aus Zeitgründen nur auf die Top5 Ligen angewendet.
Für diese Analyse habe ich etwas Hirnschmalz und 30 Min benötigt. Ganze 20 Min habe ich für Datenbesorgung und Datenbereinigung benötigt.
Wir finden oben im Ranking die üblichen Verdächtigen. Finden aber auch einige Teams, die uns wohl etwas überraschen und einen vertieften Blick wert sind.
So können Datenanalysen helfen, neue, spannende und resultatunabhängige Dinge zu entdecken. Dinge die sogar unseren Wahrnehmungsverzerrungen entfliehen.
Daten erfolgreich nutzen, ist weit mehr als nur Tools einkaufen. Diese sind wirklich gut, aber eben auf die Masse ausgerichtet. Ich ermutige alle Vereine selber in Data Analytics und Menschen mit Know-how zu investieren.
Nur so kann man seinen individuellen Weg gehen und das volle Potential der Datenanalyse erkunden und nutzen..
Als weiteres Beispiel für einen Index hier der Passgefahr Index
Indizes kann man auf jede Position anweden. Man kann auch gewisse Eigenschaften messen, in dem man verschiedene Metriken zu einem Index bündelt. Wir sind gespannt auf eure Indizes. Einfach ausprobieren, denn Experimente können gar nicht scheitern.
Eine smarte Nutzung von Daten hilft:
Vereinen: Bessere Spieler für weniger Geld zu verpflichten
Scouts: Grosse Zeiteinsparung, da man sich auf eine limitierte Anzahl mit Daten vorselektierte Spieler konzentrieren kann. Interessante und unbekannte Spieler zu finden
Trainern & Analysten: Wahrnehmungen zu bestätigen oder zu hinterfragen und die Leistung zu optimieren
Spielern: Genau zu wissen, wo sie in Bezug auf ihre Leistung stehen und welches die Entwicklungsschwerpunkte sind
Agenten: Ihre Spieler besser einzuschätzen, besser zu verkaufen und am richtigen Ort weiterzuentwickeln
Allen: Bessere und nachhaltigere Entscheidungen zu treffen
Wir wollen im 2024 die Anzahl Kooperationen (Projekte, Datananalysen, Artikel) mit Dritten erhöhen. Ihr könnt uns für gemeinsame Initiativen genereller Art gerne kontaktieren.
Daten selbst sind für Menschen nicht wertvoll. Es ist die Fähigkeit, Daten zu nutzen, um Erkenntnisse über Dinge zu gewinnen, die den Menschen wichtig sind.
"Die wahre Entdeckung besteht nicht nur darin, Neuland zu finden, sondern auch darin, die Dinge mit neuen Augen zu sehen." Marcel Proust
Hat Dir die Qualität unseres Beitrags gefallen? Dann belohne uns mit Deinen "Credits" und like und teile diesem Beitrag innerhalb Deines sozialen Netzwerkes. Besten Dank.
Um keinen Beitrag zu verpassen kannst Du unseren Blog abonnieren.
footballytics – improve the game - change the game
Wir unterstützen Vereine, Trainer, Agenturen und Spieler mit Analyse- und Beratungsdienstleitungen beim Nutzen und Interpretieren von Daten. Um im Scouting, in der Spielanalyse und auf dem Spielfeld die besseren Entscheidungen zu treffen.
Blog von www.footballytics.ch Über Data Analytics Themen im Fussball - improve the game - change the ǝɯɐƃ
Teilen Sie diesen Beitrag
留言