Mein Daten-Summery zur Saison, die Vollversion der "Team Goals", wie ich sie aktuell nenne. Dabei habe ich meinen Modus Operandi über die fehlenden Spiele beibehalten und einfach meine Rohdaten komplettiert. Ein paar Zusatzfeatures sind hinzugekommen, aber dazu separat im zweiten Teil.
Noch einmal zur Erinnerung: ich habe insgesamt 129 Datensätze weggespeichert, die im Prinzip die Aufstellung, die Anzahl der Minuten, Tore und xG von uns und dem jeweiligen Gegner beinhalten. Ziel der Statistik war eine Lücke in den im Netz verfügbaren Daten zu füllen:
Wie gut war die Mannschaft, wenn ein bestimmter Spieler auf dem Platz stand?
Da ich sowohl tatsächliche Tore und Gegentore, sowie xG und xGA auf 90 Minuten habe und diese in eine +/- Summe verrechnet habe, um die Wichtigkeit eines Spielers auszudrücken, fehlte immer noch die eine Kennzahl, auf die ich mich beziehe. Ich hatte im Prinzip 6, bzw. 2 KPIs und das war nicht konkret. Um da keine Wissenschaft draus zu machen, habe ich einfach Tordifferenz in 90 Minuten und XG-Differenz in 90 Minuten miteinander addiert und dann durch zwei geteilt. Also gilt: Tatsächliche Tore sind genauso viel Wert wie Expected Goals, um Glück/Pech abzumildern, aber auch nicht völlig aus dem Bild zu nehmen.
Hier nun das Endergebnis nach 34 Bundesliga-Spielen für unseren Kader:
Ich möchte noch einmal auf den sehr großen Einfluss von Heim- und Auswärtsspielen hinweisen (Guerreiro und Delaney hatten eher Auswärtsspiele, Hakimi über 60% Heimspiele), denn wir schießen zuhause ca. doppelt so viele Tore wie auswärts. Und der weitere Verzerrer, der bisher identifziert wurde, ist Starter vs. Joker. Wir sind sehr viel besser nachdem gewechselt wurde, was Alcácer und auch Larsen positiv beeinflusst. Von Beginn an, spielten sie schlechter.
Aber dennoch kann man vieles gut sehen, u.a. dass uns mit Pulisic und wohl auch Guerreiro, zwei wichtige Stützen verlassen. Und das mit Hakimi, Pulisic und Guerreiro drei wichtige Stützen leider oft ausgefallen sind und das Team darunter zu leiden hatte.
Man kann noch deutlich mehr daraus ziehen, aber das meiste habe ich bereits gepostet (wer ist gut zuhause, wer ist gut von Beginn an, wer ist gut für die Offensive und wer für die Defensive, etc.).
Abschließend bleibt zu konstatieren, dass eine wichtige Frage nicht beantwortet wurde: Wie stark war der Gegner als der Spieler auf dem Platz war?
Das habe ich im Folgenden versucht zu beantworten:
Strength of Schedule oder die "Team Goals Weighted", extra für
@Mystic587 (danke für das Feedback
)!
Ich habe für jeden Gegner dessen aktuelle Tabellenposition (1. Spieltag gegen RB zählte deren letzte Platzierung in der Vorsaison) hinzugenommen! Warum nicht die finale Position? Weil ich eventuell die Statistik auch nächste Saison pflege und immer aktuelle Daten haben will. Da kann ich nicht auf das Ende der Saison waren...
Wie dem auch sei, auch diesen Wert habe ich in Bezug auf die Anzahl der Minuten pro Datensatz bezogen. Aber die große Frage war, wie fließt die Platzierung in die Team Goals ein? Ich habe mich erstmal für folgende Prozedur entschieden.
Im Durchschnitt haben wir gegen die Mannschaft auf Position 9,58ff gespielt. Das war mein Ausgangswert (nächste Saison gehe ich wahrscheinlich einfach glatt von 9,5 aus). Dann habe ich davon die tatsächliche Platzierung in Relation gesetzt, mit dem Ziel, dass ich einen Aufschlag auf die Teamgoals vergebe, wenn wir gegen eine Mannschaft spielen, die besser als 9,58 platziert ist und einem Abschlag, wenn die Mannschaft schlechter platziert ist.
Einfaches Beispiel: Wir spielen gegen Nürnberg, die 18. waren, also können bis zu 0,85 Punkte von den Team-Goals auf 90 Minuten abgezogen werden. Aber der Einfluss war mir zu hoch. Deshalb habe ich den Einfluss auf 10% begrenzt, was dazu führte, dass jemand, der gegen Bayern durchspielen musste (die waren im Rückspiel 2.) insgesamt 0,075 Teamgoals hinzugerechnet bekommt. Warum 10%? Ehrlich gesagt, habe ich dafür keine wirkliche Antwort. Habe etwas mit den Daten experimentiert und versucht den Impact aufzunehmen, aber mir war nicht wohl dabei, die Statistik zu stark vom aktuellen Tabellenstand eines Gegners abhängig zu machen. Wenn man den Einfluss hochzieht, dass knallt das insbesondere Spieler mit wenig Minuten komplett in unterschiedliche Richtungen.
Ein Trend ist aber klar zu sehen. Hier die Statistik:
Anmerkung 1: sorry für die Zellumrandung bei Schmelzer.. Fehler beim Screenshotten
Anmerkung 2: Die letzte Spalte ist ein reiner Mittelwert der Tabellenposition der Gegner. Also völlig ungewichtet auf Basis der Minuten. Aber es hilft ungefähr die Varianz zu verstehen die insbesondere Diallo und Piszczek unterscheidet, um mal ähnliche Positionen und hohe Anzahl Minuten zu vergleichen).
Wo sind die fetten "Swings"?
Positiv u.a. bei: Dahoud, Weigl, Hitz, Piszczek
Negativ u.a. bei: Götze, Diallo und Wolf
Man merke also, wenn man den Einfluss der Gegnerstärke hochzieht, dann werden die Swings nur noch höher und Piszczek würde z.B. immer mehr Richtung Top 5 gehen (Dahoud auch, aber mit wenig Minuten als Grundlage) und Diallo würde sogar noch hinter Larsen landen.
Wir lernen also, dass Guerreiro und Hakimi noch wichtiger für uns sind, als gedacht, dass Dahoud fast nur gegen starke Gegner gespielt hat (da aber fast immer auch nur als Joker) und das ich dringend mal Diallo anschauen muss, ob der auch als IV so schlecht abschneidet, wie hier.
Am Ende der Fahnenstange lauern nämlich folgende Spieler weiterhin: Wolf, Larsen und Diallo. Dann Götze und Weigl. Dann folgt ein großer Bereich der Vielspieler mit wenig Varianz zwischen Delaney und Bürki.
Es bleibt also dabei: wir brauchen einen guten LV, einen guten MS, dringend starken Ersatz für die deutlichen Schwächungen durch den Abgang von Pulisic und Guerreiro und dann als nächstes eine Alternative für Delaney (Dahoud kommt bei mir besser weg, als der Eye Test, also verlassen wir uns mal auf die Kaderplanung, um das Schlussendlich zu beantworten).