Gut, da kann mystic aber nichts dafür, im Gegenteil. Fachbegriffe übersetzen ist meistens eine noch viel schlechtere Idee.
Na gut, das mag bei einigen Sachen stimmen. Beispielsweise weiß ich wirklich nicht, wie ein sampling bias in Deutsch heisst, aber ein ill-posed problem kann in dem Fall als überbestimmtes Gleichungssystem bezeichnet werden (mehr Gleichungen als Variablen, ca. 230k Events in einer Saison (Gesamtanzahl der Possession), währenddessen "nur" ca. 480 Spieler als Variablen vorhanden sind); multicollinearity ist einfach Multikollinearität (Spieler haben mitunter viele ihrer Minuten mit einem oder mehreren anderen Spielern zusammen, sodass sie schwer von einander getrennt werden können) und overfitting ist halt eine Überanpassung, bei der dann jedwede kleine Abweichung dazu genutzt wird, um eine Separation zwischen Spielern herzustellen (besonders bei Spielern, die oft zusammenspielen, weil sie unterschiedliche Positionen bekleiden), die so nicht realistisch ist.
Aber wenigstens habe ich nicht einfach ein paar Gleichungen hingeknallt; zumindest mal ein Fortschritt. Ich hatte es auch schon geschafft, einfach so etwas zu hinterlassen:
β = (X^(T)X + λI)^(-1)X^(T)y
mit
bias(β) = -λUβ
wobei
U = (X^(T)X + λI)^(-1)
und
β - Vektor der Koeffizienten
X - Design-Matrix (unabhängige Variablen)
X^(T) - transponierte Design-Matrix
y - Vektor der abhängigen Variablen
λ - Penalisierungsparameter (heisst das so auf Deutsch?)
um Ridge Regression zu erklären. So, wenn man jetzt keine Ahnung hat, was Vektoren und Matrizen sind, sowie Matrix-Algebra nicht versteht, bringt das mal den Leuten überhaupt nichts. Aber so sieht dann die Mathematik dahinter in der Tat aus. Jetzt wandelt man einfach das pbp in so eine Design-Matrix um, in dem die Heimspieler, die auf dem Feld sind, dann einfach alle eine 1 zugeschrieben bekommen, während bei den jeweiligen Auswärtsspieler -1 steht. Das jeweilige Ergebnis der Possession wird in den dazugehörige y-Vektor geschrieben (also 0, 1, 2, 3, 4, etc. Punkte, je nachdem, wie viele denn erzielt wurden). Anschliessend nutzt man das, um via cross validation das λ zu bestimmen (dabei wird einfach versucht, mit Hilfe einer Teilmenge der Stichprobe ein andere Teil der Stichprobe bestmöglich "vorherzusagen"), was eben die kleinste Abweichung präsentiert. Wenn man dann das λ hat, ergibt sich dann der Rest von selbst.
Wenn dann noch ein prior genutzt wird, dann wird da entweder ein Term für die angenommene Verteilung oder aber ein Vektor mit den jeweiligen prior-Werten für die einzelnen Spieler als Koeffizient jeweils der transponierten Matrix vorangestellt. Dadurch werden die Ergebnisse (also die βs) einfach in eine vorgegebene Verteilung gezwungen, und entwickeln sich dann in Abhängigkeit von dem gewählten prior-Wert.
Dann könnte man das noch gewichten, in dem man bestimmten Resultaten einer Possession in Abhängigkeit von irgendetwas (beispielsweise in Abhängigkeit der gespielten Minuten im Spiel, oder vom Ergebnis, oder ob es ein b2b oder 4in5 Spiel ist, etc. pp.) eine höhere/niedrigere Wertigkeit zuspricht.
Am Ende muss man muss sich denn Effekt der ridge regression gegenüber der Methode der kleinsten Quadrate dann in etwa so vorstellen, als ob jemand gegen ein Gummiband ankämpft und nur wenn er stark genug daran zieht, kann er sich effektiv vom Ausgangspunkt wegbewegen und dabei den Ansatzpunkt des Gummibandes verschieben. Dabei ist in unserem Fall die "Stärke" durch die Stichprobengröße und den jeweiligen Effekt des Einzelspielers bestimmt. Je größer die Stichprobe und umso stärker die Abweichung des Spielers vom Ausgangswert, desto wahrscheinlicher wird eine Verschiebung. Daraus ergibt sich ein Problem, wenn ein Spieler nämlich nur sehr selten aufgestellt wird, dann kann er sich kaum vom initialen Wert entfernen. Wenn kein prior angesetzt ist, dann ist der initiale Wert 0 (also der erwartete Durchschnitt am Ende), weswegen dann besonders schlechte Spieler, die wegen ihrer mangelnden Fähigkeiten nicht eingesetzt werden, eher dazu tendieren, mit dem Verfahren überbewertet zu werden. Nimmt man dann allerdings von vorneherein an, dass solche Spieler schlecht sind, dann bekommt man am Ende ein Resultat, was eine bessere Vorhersagequalität hat. Auch für andere Spieler hat der prior den Effekt, dass die Varianz in einer kleineren Stichprobe quasi überdeckt werden kann, was letztendlich zu mehr Stabilität und bessere Prognosefähigkeit führt,
Na gut, keine Ahnung, ob das jetzt hier hilfreicher insgesamt ist ...
Wenn jemand Fragen hat, kann ich gern versuchen sie zu beantworten oder mit besseren Beispielen zu illustrieren.