Das habe ich doch genauso gesagt, daher verstehe ich die Frage nicht.
Du sagst Statistiken können irren; ich sage, dass es nicht geht, weil sie keinen eigenständigen Sinn haben, sie sind nur Zahlen, die erst von Menschen interpretiert und - insoweit habt ihr Recht - nach einem bestimmten Zweck (ich nenne es mal "Forschungsansatz") aufgestellt werden müssen.
Dem würde ich widersprechen . Wie oben geschrieben: Statistiken sind nicht einfach "da", sondern werden von Menschen aufgenommen bzw. berechnet. Schon dieser Schritt hat einen erheblichen Einfluss auf die möglichen Aussagen, die später in selbige Statistik hinein"interpretiert" werden können. Das zu vernachlässigen ist grob fahrlässig.
Ich möchte dir nicht zu Nahe treten, aber bist du sicher, dass du verstanden hast, was eine Statistik überhaupt ist (das meine ich wirklich nicht böse). Wenn es z.B. jetzt eine Statistik gebe (es ist nur eine willkürliche Annahme zur Erläuterung), die sagt, dass die Korrellation zwischen Deliquenz und Migration 0.3 (also Korrellationkoeffizienten = 0.3) wäre, ist das einfach so. Wenn es eine Statistik gibt, dass 10% der Arbeitslosen Alkoholiker sind, ist das auch so. Die Zahl als solche kann nicht falsch sein, sondern nur die Interpretationen oder Theorien, die mir ihr aufgestellt werden. Man kann Statistiken natürlich nutzen, um komische Aussagen irgendwie zu belegen, obwohl es an der Haaren herbei gezogen ist (du nennst das vielleicht umgangssprachlich "fälschen" auch wenn es der Sache eigentlich gar nicht gerecht wird). Das macht die Statistik als solche doch nicht falsch. Vielleicht ist sie weniger wertvoll (vielleicht auch wertlos), weil der unterstellte Zusammenhang in Wirklichkeit viel geringer ist oder weitere beeinflussende Faktoren weggelassen/vergessen wurden. Aber "fälschen" ist es nicht. Der Fehler steckt auch hier in der Interpretation oder in Ermangelung eines komplexeren, besseren Systems (aus welchen Gründen auch immer), also wieder ein Fehler des Menschen, nicht der Zahl.
Ist das so? Diese Berechnungen werden ja von Menschen angestellt, die irgendetwas mit diesen Zahlen ausdrücken möchten. Es wurden ja nun ganze Bücher darüber geschrieben, warum ein Steal in Statistik A x-mal so viel Wert ist wie ein Block. Von daher sehe ich das nicht so hochtheoretisch wie du: Natürlich sollen Statistiken einen eigenständigen Sinn haben und suggerieren eine ganz bestimmte Interpretation. Niemand berechnet doch irgendwas ohne dahinter einen Sinn zu geben.
Du tust geradezu so, als ob Advanced Stats einfach so "entstehen" würden. Dies ist natürlich offensichtlich nicht der Fall. Advanced Stats werden sehr offensichtlich berechnet, um bestimmte Sachverhalte darzustellen. Und diese Festlegung erfolgt lange vor einer möglichen Interpretation.
Du tust so, als ob der Entwickler einer Statistik das Ergebnis seiner Berechnungen kennt und sie darauf aufbaut. So funktioniert das aber nicht, deine Erklärung geht ja schon in die richtige Richtung mMn.
1) Er wird vorher festlegen, über was er Aussagen treffen möchte, beispielsweise, wie ein Team mit einem bestimmten Spieler auftritt/abschneidet und ohne ihn.
2) Dann wird er überlegen, welche statistischen Methoden zur Verfügung stehen, um aus Zahlen, die am Ende herauskommen, bestimmte Interpretationen zu erhalten.
Bis hierhin hat der Ersteller noch keine Ahnung, wie gut sein System überhaupt funktioniert. Es ist doch nicht so, dass er diese Zahl in eine feste Schublade steckt und seine Überlegungen nicht anpassen würde. Vielleicht funktioniert das System nicht ausreichend gut und die Werte, die herauskommen, passen nicht zu den Realitäten. Aber das bedeutet doch nicht, dass die Statistik irrt, sondern der Typ, der sie aufgestellt hat. Unsere Aufgabe als verantwortungsvolle Kritiker (
) besteht darin, zu bewerten, ob die Zahlen die Realititäten gut abbilden oder nicht. Wenn sie es nicht tun, ist die Zahl, die heraus kommt, aber doch nicht falsch. Sie ist vielleicht wertlos bzw. hat einen geringen Wert (siehe Redemptions Beitrag), aber einen mathematischen (also handwerklichen) Fehler wird sie nicht haben, mithin irrt sie nicht.
Dem würde ich widersprechen
. Wie oben geschrieben: Statistiken sind nicht einfach "da", sondern werden von Menschen aufgenommen bzw. berechnet. Schon dieser Schritt hat einen erheblichen Einfluss auf die möglichen Aussagen, die später in selbige Statistik hinein"interpretiert" werden können. Das zu vernachlässigen ist grob fahrlässig.
Aber genau das sage ich doch. Interpretation nehmen die zentrale Rolle in der Bewertung einer statistischen Methode ein. Meinst du, ich nehme das APM einfach so hin und hinterfrage es nicht kritisch? Das wäre in der Tat grob fahrlässig. Es gibt 1000 Kritikpunkte gegen das System. Wenn man es jedoch schafft, mit Vorsicht und einer gewissen Distanz an die Zahl, die das APM ausspuckt, herangeht, kann man unter Umständen sinnvolle Schlüsse daraus ziehen. Blind dieser Zahl zu vertrauen, das liegt auch mir fern. Man muss immer den Kontext beachten.
Fülle das doch bitte mal mit Leben. Welche "richtige Anwendung" gibt es denn bei den Werten, die Basketballvalue da publiziert? Wie muss ich die denn interpretieren? Und warum hat Earl Watson nun so einen guten Wert?
Du stellst mir die schwierigste Frage, die man jemanden überhaupt stellen kann, wenn es um dieses Thema geht.
Wenn ich eine 100%ig richtige Antwort wüsste, würde ich ein Buch darüber schreiben und Experte bei ESPN sein.
Was mir beim APM wirklich missfällt, sind die kurzfristigen Daten, die im Modell enthalten sind. Die APM von nur einer Saison, möglicherweise bei einem Spieler, der nur 16 Minuten pro Spiel sieht (siehe Earl Watson) sind für mich per se schon nicht gerade aussagekräftig. Was sagt uns also der kranke Wert von Earl Watson? Ich würde mich für folgende Interpretation hinreißen lassen, nämlich, dass er aufgrund seiner Stärken sehr gut ins System der Utah Jazz passt (mehr würde ich schon gar nicht sagen, von Vergleichen der Zahlen mit anderen Spielern, die ganz andere Rollen ausfüllen, ganz zu schweigen; das ist mMn total daneben, gerade dann, wenn man sagt, dass jemand mit +15 wertvoller ist als jemand mit +8 , wenn der +16 Spieler vielleicht nur 10 mpg sieht und der +8 Spieler 48!).
Gerade im Fall Watson sind die APM-Werte von Al Jefferson interessant, denn jeder, der diese Saison ein paar Spiele der Jazz gesehen hat, wird bestätigen, dass Millsap auf der 4 und Jefferson auf der 5 nicht gut zusammen passen und gerade letzterer extreme Probleme mit dem Spielsystem unter Sloan und auf der Centerposition hat und siehe da; seine Werte sind im Keller (übrigens waren sie bisher überall im Keller, auch eine interessante Sache, die Interpretationen zulässt, das wirst du sicherlich nicht bestreiten). Denn gerade über einen längeren Zeitraum, mit einem dann großen Datensatz und möglicherweise verschiedenen Teambesetzungen nähern sich die Daten mMn immer mehr an die Realitäten an. Daher finde ich den
langfristigen Ansatz von Mystic sehr sinnvoll, wenn man auch hier vorsichtig damit umgeht. Das ist auch der Grund, warum ich diese Allstarwahl aufgrund irgendwelcher APM total bescheuert finde ohne einen sinnvollen Filter. Warum werden dort Spieler, die nicht mal 25 min pro Spiel bekommen, überhaupt berücksichtigt (das ist sinnfrei)? Das alleine würde schon kräftig aufräumen, weitere müssten folgen. Aber auch hier wird wieder deutlich, wo das Problem beim APM liegt. Wie wird mit der Zahl umgegangen, welche Werte muss ich kritischer als andere sehen, welche sind - aus nachvollziehbaren Gründen - wenig aussagekräftig (Fall Watson und so weiter.
Fazit: Dein Problem ist, dass du denkst, dass die Entwickler mit dieser Zahl alles erklären wollen und das unterstellst du dann auch der Zahl und wertest sie danach. Wenn du dich davon frei machen würdest, könntest du vielleicht einsehen, dass sie - wenn man sie sinnvoll anwendet - durchaus sinnvolle Schlüsse zulassen.
Btw: Falls die Entwickler "ihre" entwickelten Zahlen wirklich so glorifzieren, sind die diesbezüglich inkompetent, und dann sollten solche sinnfreien Listen auch nicht beachtet werden. Wegen eines solches Fehlverhaltens schmeiße ich aber doch kein Modell in den Mülleimer. Es bleibt ein Werkzeug. Ein Werkzeug ist grundsätzlich erstmal eine sinnvolle Sache. Es wird erst gefährlich, wenn es in den falschen Händen kommt oder es wird wertlos, wenn es jemand benutzt, der keine Ahnung hat, wie man damit umgeht.
Wenn es nur an der Interpretation liegt, muss es dafür nun ja gute Antworten geben. Gibt es diese nicht, ist die Berechnung aus meiner Sicht wertlos.
Da hast du natürlich recht. Wenn sich keine sinnvollen und schlüssige Interpretationen aus einer Zahl ergebenm ist die Berechnung wertlos (die Zahl aber doch nicht falsch und darum geht es mir). Nochmal: Wenn eine Statistik wertlos ist weil sie die Realitäten nicht sinnvoll abbilden, ist sie nicht falsch. Man kann nur nich explizit das herauslesen, was man möchte. Vielleicht wird es mit diesen Satz deutlicher, was ich meine.
EDIT: Redemptions Beispiel gefällt mir gut, ein anderes wäre für mich, um ebenfalls von dem APM-Beispiel hier wegzukommen: PER und WS gewichten die verschiedenen Boxscore-Stats unterschiedlich. Diese Gewichtungen wurden von zwei Menschen (Berry und Hollinger) festgelegt. Alleine diese Festlegung hat doch schon erhebliche Auswirkungen darauf, welche Interpretationen aus der resultierenden Zahl möglich sind.
Natürlich hat es große Auswirkungen weil beide den Wert anders berechnen. Weder das eine Modell, noch das andere ist "richtiger" oder "falscher" als das andere. Sie müssen wieder interpretiert werden und Argumente für das eine oder gegen das andere abgewogen werden. Das muss letztendlich jeder für sich selbst entscheiden.
Ich nutze das Modell gern, solange ich genug Ahnung bei bestimmten Spielern habe, um die Werte auch interpretieren zu können.