Advanced Statistics in der Bundesliga


Big d

Bankspieler
Beiträge
29.715
Punkte
113
ich denke die Qualität der schüsse muss man auch berücksichtigen, wenn jemand viel aus der 2. reihe ballert wird er weniger tore schießen, als wenn jemand hochkarätige Chancen herausspielt.

gerade beim BVB war es ja letztes jahr oft so, dass nicht wirklich gute Chancen herausgespielt worden sind, sondern man es irgendwie erzwungen hat, wo auch viele flanken und schüsse aus schlechter Position dabei waren.
 

liberalmente

Moderator Non-Sports & Football
Teammitglied
Beiträge
37.422
Punkte
113
Ich fühl mich zumindest bestätigt, weil diese Statistiken aus dem letzten Beitrag genau meinen "gefühlten Beobachtungen" der letzten Jahre entsprechen.

Ich glaube dir, dass du dich bestätigt fühlst. Und ich glaube auch, dass dir die Statistik deswegen so gut gefällt, weil der BVB dann alles herausgeholt hat, was möglich war, der Rest ist einfach Pech, und deswegen macht man beim großen BVB kaum Fehler.
 

xEr

Bankspieler
Beiträge
12.752
Punkte
113
Ich glaube dir, dass du dich bestätigt fühlst. Und ich glaube auch, dass dir die Statistik deswegen so gut gefällt, weil der BVB dann alles herausgeholt hat, was möglich war, der Rest ist einfach Pech, und deswegen macht man beim großen BVB kaum Fehler.

Lesen ist eher nicht so deine Stärke, nech?
 

liberalmente

Moderator Non-Sports & Football
Teammitglied
Beiträge
37.422
Punkte
113
Lesen ist eher nicht so deine Stärke, nech?

Ich kann lesen, zumindest besser als du dich kritisch mit den BVB Verantwortlichen auseinandersetzen kannst.

Aber: wir müssen den Thread jetzt hier nicht zumüllen damit. War primär als Scherz gemeint, weil es einfach extrem gut zu deinen Ausführungen über den BVB gepasst hat.
 

Furiosa

Weiches Brötchen
Beiträge
13.263
Punkte
113
Gestern hatte ich mich nur nochmal drangesetzt zwei Aspekte zu visualisieren. Zum einen als Zusammenfassung der letzten Saison eine Matrix aus SoTR und PDO. Sozusagen Skill vs. Glück, oder, vielleicht treffender gesagt: Dominanz vs. Effizienz. Nach rechts werden die Teams stärker, die Abweichung nach oben / unten um den Wert 1000 beschreibt welche Mannschaften eher over oder underperformed haben:


6zg2pw72.png



Als Zweites habe ich davon ausgehend versucht die Schwierigkeit des Spielplans 15/16 darzustellen. Erst mal nur auf das Startprogramm, die ersten 4 Spiele, bezogen. Danach hat man sicherlich sowieso bessere Informationen darüber was die Teams leisten können. Über die Einteilung der Teams in die Gruppen kann man natürlich streiten, ich habe mich für folgende 5 entschieden: Die Erste besteht nur aus dem Topfavoriten, es folgen die CL Anwärter, das obere Mittelfeld, das untere Mittelfeld und die Außenseiter:

tw8o6d95.png


Auf den ersten Blick hat Stuttgart guten Chancen auf einen erfolgreichen Start, mittelschwere Heimspiele, scheinbar leichte Auswärtsspiele. Von den Topteams hat es Leverkusen wohl am Schwersten erwischt zu Beginn, zuhause gg. Hoffenheim, danach zwei Auswärtsspiele in Folge bei Hannover und den Bayern. Aber wie gesagt, die eigentliche Stärke der Mannschaften ist Stand jetzt natürlich nur zu einem gewissen Grad einschätzbar.
 

Furiosa

Weiches Brötchen
Beiträge
13.263
Punkte
113
Da meine geplante Arbeit zu großen Teilen die "Expected Goals" behandelt und ich dabei hauptsächlich auf die Bundesliga blicke möchte ich an der Stelle mal eine kleine Einführung verfassen, die das Konzept erklären soll. Wer also mit dieser Statistik vertraut ist kann sich das Weiterlesen sparen.

Soweit ich mich erinnere hat Heiko (der hier anscheinend leider nicht mehr postet?!) die expected goals (ich werde in Zukunft mit expG abkürzen) öfter mal erwähnt, kein Wunder, seit 1-2 Jahren ist es der heißeste shit in der Fußball-Analyse.

Wie der Name andeutet misst die Statistik wie viele Tore ein durchschnittliches Team anhand der Chancenqualität erzielen würde. Jedem Torversuch (egal ob erfolgreich, geblockt, gehalten oder daneben) wird dabei eine Wahrscheinlichkeit anhand der Qualität zugeordnet, also eine Zahl zwischen 0 und 1. Die Summe aller Wahrscheinlichkeiten für ein Team ergibt logischerweise die endgültige expG Zahl. Der große Vorteil dieser Statistik ist eben die Tatsache, dass es den Verlauf eines einzelnen Spiels viel besser darstellt als die zuvor besprochenen TSR & SoTR, ebenso ist die Vorhersagequalität schon nach wenigen Spielen höher als bei SoTR. Außerdem kann man natürlich sowohl Teams, als auch Spieler in die Analyse mit einbeziehen.

Der Nachteil ist der ungleich höhere Aufwand bei der Berechnung sowie Erstellung der benötigten Formel.

Für meine Formel habe ich zunächst einmal viele Abschlüsse und (Tor)Statistiken über whoscored betrachtet und zusammengezählt. Die Frage dabei: Welche Parameter beeinflussen die Erfolgswahrscheinlichkeit eines Abschlusses in welchem Ausmaß?

Ohne jetzt hier die ganzen Werte minutiös auszuwerten sind offensichtliche folgende Variablen für die Torwahrscheinlichkeit wichtig:

1.) Entfernung und Winkel zum Tor
Keine Frage, wie weit man beim Schuss vom Tor entfernt ist spielt die wohl größte Rolle, als Beispiel: Im Durchschnitt geht ein Schuss aus 18 Metern zentral vor dem Tor nur zu gut 6% rein, aus 11 Metern sind es schon fast 18% und kommt man aus 5 Metern zum Abschluss steigt die Wahrscheinlichkeit auf über 40%.

2.) Defensiver Druck
Dies lässt sich leider weder über whoscored (oder OPTA) einsehen noch gut quantifizieren, hat aber natürlich einen enorm hohen Einfluss. Ich nehme als Ersatz die Spielgeschwindigkeit vor dem Abschluss, also wie schnell der Angriff vortragen wird. Ein durchschnittlicher Konter verdoppelt etwa im Schnitt die Erfolgswahrscheinlichkeit, was natürlich enorm ist. Ein langsamer Angriff, wenn die Defensive also Zeit hat sich zu formieren, verringert dementsprechend die Chance.

3.) Kopfball oder Schuss
Das ist zum Glück wieder leicht über whoscored zu kontrollieren, Kopfbälle sind eindeutig schwächere Abschlüsse, egal aus welcher Entfernung. Die erwähnten 18% aus 11 Metern verringern sich auf 5% wenn es sich um einen Kopfball handelt.

4.) Art der Vorbereitung
Auch sehr wichtig, nur kurz die Unterteilung von schwacher Chance zu hochprozentig: 4a) Schuss oder Kopfball nach einer Flanke / 4b) Schuss nach Dribbling / 4c) Schuss nach einem through ball / 4d) Schuss nach einem Rebound (also wenn der Ball vom TW abgewehrt wurde oder vom Pfosten zurück springt)

Ein through ball ist bei whoscored ein Pass, der die komplette Defensivreihe "schneidet", sehr oft hat man also danach freie Schussbahn und ist relativ unbedrängt vor dem Torwart.


Desweiteren gibt es natürlich Besonderheiten bei Standards. Ecken sind tendenziell ungefährlicher, direkte Freistöße haben eine höhere Aussicht auf Erfolg im Vergleich zu einem Schuss aus dem Spiel heraus von derselben Stelle.

Ich nehme zur Veranschaulichung mal als fixes Beispiel das gestrige 1:0 des BVB:

eUp15w.gif


Was das Modell hier also erkennen würde:

-Schuss aus ca. 6,5 Metern zentral vor dem Tor
-Spielgeschwindigkeit von ungefähr 7,5 Meter/Sek

=> expG von 0,733.

Die Formel würde hier also eine 73%ige Erfolgswahrscheinlichkeit ausspucken, was ganz gut hinkommt. Quasi annährend im Bereich eines Elfers (78%).


Hier nochmal eine wie ich finde gelungene Grafik, die ich auf 2plus2equals11 gefunden habe und die ganz gut die Erfolgswahrscheinlichkeit in Abhängigkeit der Distanz sowie des Winkels illustriert:




Ich baue meine Datenbank der expected Goals erst zur demnächst startenden Saison auf, werde im nächsten Post aber mal ein paar Schlüsselspiele des letzten Jahres / der letzten Jahre auf ihre expG bzw. expG Ratio untersuchen. Falls jemand da einen Wunsch hat nur zu. ;)
 
Zuletzt bearbeitet von einem Moderator:

Hans A. Jan

zu gut für die 3. Liga
Beiträge
21.281
Punkte
113
Wow, die Erkenntnis ist, um so näher ich am Tor bin, desto wahrscheinlicher ist ein Treffer. Bahnbrechend. Dies wird den Fußball nachhaltig revolutionieren.
 

liberalmente

Moderator Non-Sports & Football
Teammitglied
Beiträge
37.422
Punkte
113
Die Formel würde hier also eine 73%ige Erfolgswahrscheinlichkeit ausspucken, was ganz gut hinkommt. Quasi annährend im Bereich eines Elfers (78%).

Beim Torschuss von Hofmann gibt es nur eine 73 %ige Erfolgswahrscheinlichkeit? Nur zum Verständnis. Denn das würde mich echt niedrig vorkommen. Wenn Hofmann diesen Schuss 10 mal bekommt, erwarte ich ehrlich gesagt, dass er ihn 10 mal verwandelt. Für einen Profifußballer darf das ja echt keine Schwierigkeit sein. Von 100 Versuchen könnte ich mit 2 oder 3 Fehlschüssen, durch Torwartparade oder den Ball nicht richtig erwischen, leben.

Soll jetzt nicht das Modell kritisieren. Mir kommen die 73 % nur einfach sehr niedrig vor, deshalb hake ich ein bisschen nach.
 

Furiosa

Weiches Brötchen
Beiträge
13.263
Punkte
113
Wow, die Erkenntnis ist, um so näher ich am Tor bin, desto wahrscheinlicher ist ein Treffer. Bahnbrechend. Dies wird den Fußball nachhaltig revolutionieren.

ich war genauso schockiert. meine arbeit sollte damit abgeschlossen sein. ;)

Beim Torschuss von Hofmann gibt es nur eine 73 %ige Erfolgswahrscheinlichkeit? Nur zum Verständnis. Denn das würde mich echt niedrig vorkommen. Wenn Hofmann diesen Schuss 10 mal bekommt, erwarte ich ehrlich gesagt, dass er ihn 10 mal verwandelt. Für einen Profifußballer darf das ja echt keine Schwierigkeit sein. Von 100 Versuchen könnte ich mit 2 oder 3 Fehlschüssen, durch Torwartparade oder den Ball nicht richtig erwischen, leben.

Du hast wohl recht, intuitiv sollte die wahrscheinlichkeit wohl höher sein. letztlich ist natürlich jeder abschluss einzigartig und man muss wege finden irgendwie zu abstrahieren. vielleicht wäre es sinnvoll hier als assist noch den through ball hinzuzufügen, die wahrscheinlichkeit stiege dann auf 87%. ich weiß nicht was whoscored dazu sagt, el quali spiele werden da kaum analysiert. die 97%ige Chance sehe ich aber dennoch nicht wie du, dafür gibt es einfach gefühlt trotz vermeintlicher topchancen zu wenig tore.

das Modell darf ansonsten natürlich nach Herzenslust kritisiert werden, es verändert sich sowieso mit jeder neuer Erkenntnis. :thumb:
 

xEr

Bankspieler
Beiträge
12.752
Punkte
113
Beim Torschuss von Hofmann gibt es nur eine 73 %ige Erfolgswahrscheinlichkeit? Nur zum Verständnis. Denn das würde mich echt niedrig vorkommen. Wenn Hofmann diesen Schuss 10 mal bekommt, erwarte ich ehrlich gesagt, dass er ihn 10 mal verwandelt. Für einen Profifußballer darf das ja echt keine Schwierigkeit sein. Von 100 Versuchen könnte ich mit 2 oder 3 Fehlschüssen, durch Torwartparade oder den Ball nicht richtig erwischen, leben.

Soll jetzt nicht das Modell kritisieren. Mir kommen die 73 % nur einfach sehr niedrig vor, deshalb hake ich ein bisschen nach.

Lies dir nochmal den Post von Alice durch, dort wird doch klar verständlich wie sie auf die 73% kommt. Natürlich bezieht sich die Wahrscheinlichkeit anhand der Formel nicht exakt auf diese Situation, sondern z.B. wird der defensive Druck anhand der Spielgeschwindigkeit angenähert. Solange du keine superkomplexen Formeln mit 1000 Variablen hast, kriegst du immer nur Annäherungen. Wenn die (kurze) Formel gut ist, gleichen sich die Abweichungen auf lange sich jedoch vielleicht wieder teilweise aus und man kommt insgesamt auf eine ziemlich genaue Wahrscheinlichkeit.


Wow, die Erkenntnis ist, um so näher ich am Tor bin, desto wahrscheinlicher ist ein Treffer. Bahnbrechend. Dies wird den Fußball nachhaltig revolutionieren.

Es geht hier doch nicht bzw. weniger um die Erkenntnis, als mehr um die Aussagekraft der Statistik und der daraus abgeleiteten "Expected Goals". Anhand derer kann man jedenfalls inhaltlich viel gehaltvoller argumentieren als mit so "Gefühlssaussagen" wie "Mannschaft A hat klar dominiert und hätte eigentlich 4:0 gewinnen müssen".
 

Hans A. Jan

zu gut für die 3. Liga
Beiträge
21.281
Punkte
113
Alles gut. Ich lese hier amüsiert bin und bin fasziniert, mit welch Hingabe man sich solcher Statistiken zuwenden kann.
 

liberalmente

Moderator Non-Sports & Football
Teammitglied
Beiträge
37.422
Punkte
113
Ich habe nicht die Expertise, um die Zahl innerhalb des Modells zu kritisieren, deswegen mache ich das auch nicht. Ich wollte lediglich darstellen, dass die 73 % für mich kontraintuitiv sind.

Entscheidend für mich bei der gezeigten Szene ist eben, dass es quasi ein Torschuss aus 6 Metern ohne Torwart ist. Wenn der Torwart zentral steht oder gar die kurze Ecke zumacht wären die 73 % für mich verständlich, vielleicht sogar gefühlt ein wenig hoch. Aber 6 Meter, freie Schussbahn, im Prinzip leeres Tor (alles was Hofmann vermeiden muss ist die lange Ecke anzuvisieren) - auch wenn es eine Spiel- und keine Trainingssituation (Druck) ist und zudem natürlich mit entsprechender Geschwindigkeit gespielt, die Szene wäre für mich eher etwas besonderes, wenn er ihn vorbeischießt. Ich will jetzt nicht Gomez gg Österreich sagen (was intuitiv eine 99 % Torchance ist, die vergeben wurde), aber weit davon entfernt ist es für mich gefühlt nicht (weshalb ich die 97 % genannt habe).

Wie gesagt, entscheidend ist für mich die Position des Torwarts. Wobei die vom Modell nicht berücksichtigt wird, wenn ich das richtig sehe, von daher machen die 73 % dann auch innerhalb des Modells Sinn. Will die super interessanten Posts nicht kritisieren, aber vielleicht war das Beispiel nicht so gut gewählt, Alice. ;)
 

Furiosa

Weiches Brötchen
Beiträge
13.263
Punkte
113
Es geht hier doch nicht bzw. weniger um die Erkenntnis, als mehr um die Aussagekraft der Statistik und der daraus abgeleiteten "Expected Goals". Anhand derer kann man jedenfalls inhaltlich viel gehaltvoller argumentieren als mit so "Gefühlssaussagen" wie "Mannschaft A hat klar dominiert und hätte eigentlich 4:0 gewinnen müssen".

Naja, viele (die meisten?) Fußballfans haben mit etwas komplexerer Statistik einfach nichts am Hut, das ist völlig ok, dafür ist das Thema im Fußballbereich noch zu neu und wird durch jegliche Berichterstattung in den Alltagsmedien eh nicht gefördert. Dort ist man gefühlt in Deutschland noch immer auf dem Stand von vor 20 Jahren, ein Spieler mit vielen Assists ist der beste Spielmacher und das siegreiche Team war an dem Tag einfach besser etc. Bis man in den Mainstream-Medien da etwas Qualität gewinnt sind wohl leider noch viele Schritte möglich.

Die expected goals sind für mich einfach ein Analyse-Werkzeug, zugebenermaßen reichlich nerdig und "speziell", von dem man aussgehend aber gewisse Aussagen ableiten kann wenn man sich damit beschäftigt. Ein Teilziel von mir ist es mal eine Plusminus Statistik für die Bundesliga Spieler zu erstellen, prinzipiell nach dem Vorbild von goalimpact, nur eben basierend auf expG statt auf Toren / Gegentoren.
 

Furiosa

Weiches Brötchen
Beiträge
13.263
Punkte
113
Wie gesagt, entscheidend ist für mich die Position des Torwarts. Wobei die vom Modell nicht berücksichtigt wird, wenn ich das richtig sehe, von daher machen die 73 % dann auch innerhalb des Modells Sinn. Will die super interessanten Posts nicht kritisieren, aber vielleicht war das Beispiel nicht so gut gewählt, Alice. ;)

Stimmt, bei whoscored kann man die TW Position beim Abschluss nicht einsehen. Ob bei Opta weiß ich nicht, die Daten kann ich mir nicht leisten. ;) Vielleicht ist das Beispiel dann doch gut gewählt um gewisse Schwächen des Modells gleich mitaufzuzeigen. :)

Wichtig ist ja in der Hauptsache, dass alles über 50, 60% extrem hoch ist, ob man trifft oder nicht, aber Teams die regelmäßig Chancen dieser Kategorie kreieren machen grundsätzlich viel richtig.
 

liberalmente

Moderator Non-Sports & Football
Teammitglied
Beiträge
37.422
Punkte
113
Vielleicht ist das Beispiel dann doch gut gewählt um gewisse Schwächen des Modells gleich mitaufzuzeigen. :)

Hehe, das stimmt dann auf jeden Fall. :)

Wichtig ist ja in der Hauptsache, dass alles über 50, 60% extrem hoch ist, ob man trifft oder nicht, aber Teams die regelmäßig Chancen dieser Kategorie kreieren machen grundsätzlich viel richtig.

Ja, vor allem noch in Verbindung mit dem von xEr zurecht angesprochenen deutlich höheren sample size, wenn man eine Hinrunde oder eine ganze Saison analysiert.
 

Apollo Schwabing

Nachwuchsspieler
Beiträge
14.748
Punkte
0
Ort
Weiss ich nicht.
Wenn Hofmann diesen Schuss 10 mal bekommt, erwarte ich ehrlich gesagt, dass er ihn 10 mal verwandelt. Für einen Profifußballer darf das ja echt keine Schwierigkeit sein.

Das sage ich mir auch immer wenn ein Profi mit täglichen Training aus einer Topliga einen Elfmeter neben oder über das Tor semmelt. Oder nicht mit dem schwächeren Fuss halbwegs anständig flanken kann. Oder seine Eckbälle und Freistösse im Nirvana oder Oberrang des Stadions landen. :D Wir sollten Profi-Fussballer nicht so überschätzen. ;)
 

Steph Curry

Bankspieler
Beiträge
9.390
Punkte
113
Die expected goals sind für mich einfach ein Analyse-Werkzeug, zugebenermaßen reichlich nerdig und "speziell", von dem man aussgehend aber gewisse Aussagen ableiten kann wenn man sich damit beschäftigt. Ein Teilziel von mir ist es mal eine Plusminus Statistik für die Bundesliga Spieler zu erstellen, prinzipiell nach dem Vorbild von goalimpact, nur eben basierend auf expG statt auf Toren / Gegentoren.

Mit Toren/Gegentoren würde eine +-/Statistik im Fussball auch kaum Sinn ergeben. Dazu gibt es viel zu wenige Wechsel und gleichzeitig nicht genügend Tore. Im Basketball ist das ja relativ beliebt, und selbst da macht eine reine +-/Statistik schon nicht allzu viel Sinn, weil man eben trotz der ganzen Wechsel und nur fünf Spielern immer noch extrem von den Teamkollegen abhängig ist. Das ist im Fussball ja dann alles noch viel mehr der Fall. Wenn dann müsste man das anpassen, dazu bräuchte man aber glaube ich verdammt viele verschieden Aufstellungen usw., um zu separieren, die aber im Fussball so nie zu Stande kommen könnten.

Mit expG macht das dann schon mehr Sinn, weil die sample size solcher Wahrscheinlichkeiten ja einfach viel viel größer wird. Bin ich gespannt, wie das aussehen wird, wenn es denn klappt. :)
 

liberalmente

Moderator Non-Sports & Football
Teammitglied
Beiträge
37.422
Punkte
113
Das sage ich mir auch immer wenn ein Profi mit täglichen Training aus einer Topliga einen Elfmeter neben oder über das Tor semmelt. Oder nicht mit dem schwächeren Fuss halbwegs anständig flanken kann. Oder seine Eckbälle und Freistösse im Nirvana oder Oberrang des Stadions landen. :D Wir sollten Profi-Fussballer nicht so überschätzen. ;)

Mir geht es um die Distanz und vor allem das quasi leere Tor, Apollo. Ich finde, da darf man dann schon einen sehr hohen Anspruch an einen Profifußballer haben. ;)

Es hat ja seinen Grund, warum sehr viele den Fehlschuss von Frank Mill oder von Gomez gegen Österreich kennen. :) Und wie gesagt, so schlimm wäre ein Fehlschuss bei Hofmann sicher nicht gewesen, aber schon ein starkes Stück.
 

Furiosa

Weiches Brötchen
Beiträge
13.263
Punkte
113
Mit Toren/Gegentoren würde eine +-/Statistik im Fussball auch kaum Sinn ergeben. Dazu gibt es viel zu wenige Wechsel und gleichzeitig nicht genügend Tore.

Ich habe eigentlich die selben Bedenken, kenne aber auch nicht die komplette Methodik dahinter. Immerhin wird T. Müller nach dieser Statistik auf 1 gewertet was sie für dich vielleicht etwas aufwertet. :D

http://www.goalimpact.com/2015/07/top50-football-players-july-2015-edition.html?m=1

Finde die Ergebnisse aber teilweise zu absurd, so dass ich mich nicht weiter damit auseinandergesetzt habe.
 
Zuletzt bearbeitet von einem Moderator:

Young Kaelin

merthyr matchstick
Beiträge
50.159
Punkte
113
seltsam erscheinen mir die radien bei den expected goals... respektive das satte blau, bzw. hellblau ausserhalb des sechzehners. müssten da nicht vermehrte Tore angedeutet sein, wenn man die Freistösse berücksichtigt? fällt mir schwer die Grafik zu glauben.
 
Oben