Data Analytics Praxis: Spieler fair vergleichen

Stellt euch vor, dass ihr zwei Mittelstrecken-Läufer anhand der zurückgelegten Laufstrecke beurteilen wollt. Der erste Läufer hat für seinen Lauf 12 Minuten zur Verfügung, während der zweite 15 Minuten Zeit dafür hat.


Unfair? Ja klar, aber genau dass machen wir, wenn wir in unserer Datenanalyse die quantitativen Leistungsdaten nicht bereinigen.

Dass das "Passmonster" Marco Verratti von PSG rund 90 Ballberührungen pro Spiel verzeichnet, ist unglaublich. Doch hat PSG einen Ballbesitzanteil von über 60%. Es wäre nicht fair, ihn ohne Anpassung zum Beispiel mit Jean Onana der bei Bordeaux mit 48% Ballbesitz auf 47 Ballberührungen kommt, zu vergleichen. Auf diese Praxis-Thematik der fairen Vergleichbarkeit und der Anpassung (Adjustment) der Stats wollen wir in diesem Blog eingehen.


Um die Leistungen der Spieler fair zu vergleichen, ist es relevant, die absoluten und quantitativen Werte in den richtigen Kontext zu bringen. Beziehungsweise die Werte zuerst zu bereinigen, damit sie fair verglichen werden und möglichst belastbar und aussagekräftig sind.

Die Bereinigung der Metriken ist nicht neu und wird seit vielen Jahren verwendet. Im speziellen wurden wir für diesen Blog durch unseren geschätzten DataAnalytics Kollegen Ben Griffis aus Amerika inspiriert.


for Ben: If your actions inspire others to dream more, learn more, do more and become more, you are a true #leader

Wir zeigen in diesem Blog verschiedene Möglichkeiten zur Bereinigung von defensiven und offensiven Quantitativen-Metriken auf.




Pro 90 Minuten-Metriken (p90)

Die per 90 Minuten (p90) ausgewiesenen Metriken sind ein guter Startpunkt, um die Leistung der Spieler fassbarer und vergleichbarer zu machen. Aber eben auch nicht mehr…



Defensive Metriken aussagekräftiger machen

Schauen wir uns zuerst die defensiven, quantitativen bzw volumenbasierten Metriken an. Wie Anzahl Defensive Duelle, Interceptions, Tackles, Blocked Shots etc. Alles Aktionen die man ausführt, wenn der Gegner den Ball hat.

Wenn wir aber nur die Anzahl pro 90 Minuten verwenden, sehen wir nur die Wahrheit der absoluten Zahl. Klar. dass der Innenverteidiger A im Spiel mit 9 Interceptions einen besseren Wert aufweist, als der gegnerische Innenverteidiger B mit 7 Interceptions. Das ist aber nur die halbe Wahrheit.


Denn wenn das Team von A nur 40% Ballbesitz und das Team von B ganze 60% Ballbesitz hatte, verändert dass die Wertung. A hatte für seine 9 Interceptions 60% Gegner-Spielzeit zur Verfügung und seine defensiven Aktionen auszuführen. Während B für seine 7 Interceptions nur 40% Gegner-Spielzeit zur Verfügung hatte um seine defensiven Aktionen auszuführen.

Wenn wir den Interceptions-Wert auf faire und gleiche Dauer (50% Ballbesitz) bereinigen, dann weist auf einmal B den besseren Wert auf. als A. A (9/60*50) = 7.5 bereinigte Interceptions

B (7/40*50) = 8.75 bereinigte Interceptions


Nicht bereinigte defensive Quantitative-Werte (p90) bevorteilen Spieler von Teams mit wenig Ballbesitz, da diese mehr Zeit hatten, um ihre Defensivaktionen auszuführen.

Das Bereinigen gilt natürlich nicht für die Qualitativen Werte. Die Erfolgsquote von Dribblings oder Pässen etc wird nicht bereinigt.

Es folgen zwei Diagramme der Super League 2021-22.

Diagramm Standard mit den p90 Werten und Diagramm Adjsuted mit den ballbesitzbereinigten Werten (PAdj). Sinnbildlich für die Bereinigung könnt ihr W. Burger, C. Zesiger und L. Zuffi tracken.


Defensive Stats per 90 Min, Data: Wyscout
Defensive Stats per 90 Min, Data: Wyscout


Defensive Stats PAdj, Data: Wyscout
Defensive Stats PAdj, Data: Wyscout

W. Burger und C. Zesiger spielen mit Basel und Young Boys bei Teams mit viel Ballbesitz. Ihre defensiven Werte haben von der PAdj Bereinigung profitiert. Bei L. Zuffi ist es umgekehrt. Er ist aufgrund des geringen Ballbesitz von Sion nach der Bereinigung unter den Median gerutscht.



Die statistische Anpassung ist eine allgegenwärtige Praxis in allen quantitativen Bereichen, die dazu dient, Unregelmässigkeiten oder Einschränkungen in den beobachteten Daten zu korrigieren, den Einfluss von Störvariablen zu beseitigen oder beobachtete Korrelationen in kausale Schlüsse umzuwandeln.




Offensive Metriken aussagekräftiger machen

Bei den Offensiven Werten oder präziser ausgedrückt, bei den Aktionen mit dem Ball, ist es umgekehrt. Spieler von Teams mit viel Ballbesitz haben mehr Spielzeit zur Verfügung um ihre Ballaktionen auszuführen.


Nicht bereinigte Metriken von quantitativen Ballaktionen (p90) bevorteilen Spieler von Teams, mit viel Ballbesitz, da diese mehr Zeit haben, um ihre Ballaktionen auszuführen.


Schauen wir uns die Key Pässe und die Expected Assists an. Beide Metriken haben eines gemeinsam. Sie können nur durch Pässe entstehen. Vorher haben wir bei den defensiven Metriken mit dem Team-Ballbesitz bereinigt. Dies ist zwar bestmöglich, aber nicht perfekt. Denn eine Bereinigung auf Spielerebene mit einem Wert auf Team-Ebene zu bereinigen ist nicht perfekt. Aber besser als p90 mit gar keiner quantitativen Bereinigung.


Da wir über die Zahlen verfügen, können wir hier nun die Anzahl Pässe pro Spieler zum adjusten verwenden. Es spielt in der Qualität des Spielers sehr wohl eine Rolle, ob er seinen "Expected Assists" Wert mit 50 oder mit 30 Pässen pro Spiel generieren kann..


Es folgen zwei Diagramme der Super League 2021-22

Diagramm Standard mit den p90 Werten und Diagramm ADJUSTED mit den passbereinigten Werten. Dazu haben wir die Einheit «pro 40 Pässe» verwendet. Der verwendete Wert sollte möglichst nahe am Mittelwert liegen. Sinnbildlich für die Bereinigung könnt ihr auf den Charts M. Stevanović, J. von Moos und T. Aiyegun tracken.



Key Passes & xA per 90, Data: Wyscout
Key Passes & xA per 90, Data: Wyscout

Key Passes & xA Pass adjusted, Data: Wyscout
Key Passes & xA Pass adjusted, Data: Wyscout

Die Leistung von M. Stevanović ist immer noch gut, wird aber redimensioniert, da er pro Spiel 35.8 Pässe zur Verfügung hatte. Während die Leistungen von J. von Moos (19.5 Pässe pro Spiel) und T. Aiyegun (17.1 Pässe pro Spiel) in einem neuen Glanz erscheinen. Sie sind in der Lage ihre Leistungen mit rund der Hälfte der Pässe von M. Stevanović zu erbringen.

"Die Anzahl erhaltene Pässe für die Bereinigung zu verwenden, sei gefährlich" hab ich schon verschiedene Mal gehört. Da würde nicht berücksichtigt, wie gut sich ein Spieler anbietet oder freiläuft. Das ist absolut korrekt, aber beim offensiven Output wollen wir auch nur den offensiven Output, gemessen am Input, bewerten. Fakt: Der Spieler generiert mit weniger Bällen mehr Output. Wenn man die Bindung zum Spiel und das Anbieten und Freilaufen bewerten will, dann kann man die Anzahl Zuspiele mit anderen Spielern auf der gleichen Position vergleichen.


Es gilt immer den vollen Fokus auf die Frage zu haben, die man beantworten will.


Die Metriken die durch Pässe entstehen, werden durch die Pass-Bereinigung fairer und aussagekräftiger.



Datengestütztes Spieler Personal-Coaching

Übrigens sind wir gerade daran, erste datengestützte Spielercoachings anzubieten. Der Spieler erhält ausserhalb seines Systems eine smarte Sicht auf seine Leistungsdaten und wir erarbeiten in individuellen Taktik-Coachings gemeinsam Massnahmen, wie er seine Leistung verbessern kann.



Der Spieler ist zu einem grossen Teil Selbstverantwortlich für seine Entwicklung. Er ist zu einer Art Self-Entrepreneur geworden.

Das externe Coaching für Spieler und Trainer durch Spezialisten wird immer wichtiger, um Excellenz zu erlangen und alle Möglichkeiten und Ressourcen zu nutzen. Ob #Mentalcoach, #Athletikcoach, #Taktikcoach oder #DatenAnalysecoach... Am Ende zahlt nicht das #Talent sondern die #Entwicklung die Miete.





Ball Progression (Progressive Passes & Progressive runs)

Gleiches Prozedere wenn wir Aussagen zur Ball Progression mit den Werten «Progressive Passes» & «Progressive runs» machen wollen.


Die «Progressive Passes» entstehen durch Pässe, also bereinigen wir wieder mit «pro 40 Pässe» Während «Progressive runs» nicht durch Pässe, sondern durch erhaltene Zuspiele entstehen. Somit verwenden wir für die Bereinigung dieser Metrik «pro 30 erhaltene Pässe»


Auf den folgenden zwei Diagrammen haben wir zum tracken H. Mahou, T. Coyle, L. Millar und G. Clichy auserwählt.



Ball Progression per 90, Data: Wyscout
Ball Progression per 90, Data: Wyscout

Ball Progression Adjusted, Data: Wyscout
Ball Progression Adjusted, Data: Wyscout


Bei den bereinigten/adjusted Werten sehen wir wieder signifikante Veränderungen. H. Mahou und T. Coyle hatten haben ihre Leistung mit wenig Pässen und erhaltenen Zuspiele pro Spiel erzielt und ihre Leistungen kriegen eine stärkere Würdigung.

Während auf der anderen Seite die Leistungen von L. Millar und G. Clichy, durch die vielen Zuspiele und Pässe etwas redimensioniert wurden.






Advanced Quantitative Adjustments

Bei den in diesem Blog verwendeten Beispielen geht es um Basis-Adjustments der quantitativen Werte, die eine realistischere und fairere Sicht auf die Daten ermöglichen.


Fortgeschrittene Adjustments sind bei den Defensiven Werten anstelle des gegnerischen Ballbesitz, auch mit mit den Anzahl Ballberührungen des Gegners möglich. Wenn man über die Daten verfügt, kann man sogar nur die Anzahl der Ballberührungen im Angriffsdrittel oder Anzahl Pässe ins letzte Drittel verwenden.


Bei den Ballaktionen kann anstelle der Anzahl Pässe oder Zuspiele auch nur selektiv die Pässe Zuspiele in einem bestimmten Bereich des Felder verwenden.



Das Bereinigen der Quantitativen Daten verändert die Sicht auf die Daten, wie wir sie bisher gesehen haben. Da entsteht ein Spannungsfeld, das spannende Gespräche ermöglicht und viele Erkenntnisse auf unsere Entdeckungen warten.


Wir haben uns daran gewöhnt, bei einem Scouting immer beide Sichten (p90 & adjusted) zu analysieren. Auf alle Fälle können nicht bereinigte quantitative Werte zu falschen Annahmen, Verfälschungen und schlussendlich zu falschen Entscheidungen führen.


Je stärker die Korrelation zwischen der quantitativen Metrik und der Adjusted-Einheit ist, desto belastbarer und aussagekräftiger wird die Aussage der Datenanalyse.



Hat Dir die Qualität unseres Beitrags gefallen? Dann belohne uns mit Deinen "Credits" und like und teile diesem Beitrag innerhalb Deines sozialen Netzwerkes. Besten Dank.

Um keinen Beitrag zu verpassen kannst Du den Blog abonnieren.



footballytics – we know how to make date talk

Wir verbinden die Kompetenzen Fussball-Taktik, Scouting und DataAnalytics und beraten und unterstützen Vereine beim Interpretieren und Nutzen von Daten, um im Scouting und in der Spielanalyse datenvalidiert bessere Entscheidungen zu treffen.


 

Blog von www.footballytics.ch Über Data Analytics Themen im Fussball - improve the game - change the ǝɯɐƃ

Teilen Sie diesen Beitrag

0 Kommentare

Aktuelle Beiträge

Alle ansehen