Statistik-Talk


Robinho

Nachwuchsspieler
Beiträge
3.555
Punkte
63
Das liegt dann aber halt doch wieder daran, dass es letztes Jahr deutlich mehr verschiedene Sieger gab..
 

cultimator

Nachwuchsspieler
Beiträge
393
Punkte
16
Habe mal eine kleine Statistik erstellt, in welcher eine Rangliste der erzielten Top 3, Top 5 und Top 10 Resultate zu finden ist. Gibt es in ähnlicher Form sicher schon :)
 

skijumping66

Bankspieler
Beiträge
14.392
Punkte
113
Habe mal eine kleine Statistik erstellt, in welcher eine Rangliste der erzielten Top 3, Top 5 und Top 10 Resultate zu finden ist. Gibt es in ähnlicher Form sicher schon :)

Interessante Sache:up:

Interessant wäre dazu noch eine Spalte, in der man sehen könnte, wie viele Springen der einzelne Athlet insgesamt bestritten hat.
 

Benjamin

Zahlenfreund
Beiträge
38.423
Punkte
113
Ich will den Hauptthread einigermaßen frei von Kommentaren halten, damit es übersichtlich bleibt - deshalb meine Antwort hier:
Wie im Statistik-Planungsthread schon angekündigt, hat mich interessiert, wie stark sich die Haltungsnoten auf die Weltcup-Gesamtwertung auswirken.
Deshalb habe ich mir Saison 2014/15 herausgepickt, in der es bekanntlich sehr eng zuging und am Ende Severin Freund und Peter Prevc punktgleich waren, und schaue nach, wie diese Saison ausgesehen hätte, wenn es keine Haltungsnoten gegeben hätte.

Dazu rechne ich aus allen Wettkampfsprüngen die Haltungsnoten raus, anschließend verteile ich die Weltcuppunkte neu anhand der haltungsnotenfreien Ergebnisse. Das Ganze mache ich für alle Sprünge von Springern, die die jeweiligen Finaldurchgänge erreicht haben.
Zwar könnten die fehlenden Noten auch schon Auswirkungen darauf haben, wer überhaupt den Wettkampf an sich oder den 2. Durchgang erreicht, aber ich kann mir ja schlecht Ergebnisse für die hypothetisch erreichten Durchgänge ausdenken...

Mit der Saison 14/15 habe ich vor ein paar Tagen angefangen und bin jetzt ca. zu zwei Dritteln durch, das Ergebnis kommt also in den nächsten Tagen.

Als kleinen Vorgeschmack habe ich hier schonmal eine kurze Zusammenfassung der Vierschanzentournee-Wertung von 2014/15 ohne Haltungsnoten:
(die Pfeile geben die Rangänderung gegenüber der offiziellen Wertung an)
Anhang anzeigen 14173
Ohne Haltungsnoten hätte sich Michael Hayböck den goldenen Adler gesichert und Noriaki Kasai hätte Peter Prevc noch vom Podium gestoßen.
Die größe Veränderung im Kreise der Besten hat sich bei Dimitry Vassiliev gezeigt, der gleich zwei Plätze nach oben geklettert wäre.

Wie gesagt, die Saison-Gesamtwertung folgt in den nächsten Tagen. ;)
Kurios finde ich ja vor allem, dass Michael Neumayer ohne Haltungsnoten schlechter abgeschnitten hätte. :D
Er ist ja schließlich auch einer, dem man nachsagt, dass ihn die Haltungsnoten eher heruntergezogen hätten (und mindestens bei den Olympischen Spielen 2006 war das auch so). Aber es ist liegt wohl daran, dass er hier in direkter Nachbarschaft von Mister Kacherl persönlich lag (Dimitry Vassiliev).
 

KoN

Bankspieler
Beiträge
1.723
Punkte
113
@Lina: Du hast doch in deiner Liste die Punkte für alle Springer, die vor der Saison 1993/1994 Punkte im WC gemacht haben, umgewandelt, oder?

Hast du da auch alle Plätze bis Platz 30 berücksichtigt und denen nach der heutigen Punkteregel die Punkte gutgeschrieben?

Bin gerade selber an einer Statistik für mich dran und überlege die Punkte nur bis Platz 15 zu vergeben bei der Umwandlung.

Bei einigen Wettbewerben sind doch ein paar Lücken, wo entweder nur unter 30 Springer am Wettbewerb teilgenommen haben oder die Ergebnisse nicht vollständig sind.

15 Springer waren aber immer mindestens in der Wertung. Bin gerade in der Saison 1983/1984. Das wären dann auch die offiziell von der FIS vergebenen Punkte nur umgewandelt an die heutige Punktregel, sodass man eine Rangliste von 1979/1980 bis heute erstellen könnte.
Aber natürlich dann zum Nachteil der Springer, die vor 1993 Punkte gemacht haben...

Hm, ich muss mir das nochmal überlegen.
 

Lina_

Nachwuchsspieler
Beiträge
2.177
Punkte
48
Ort
Machteburch
@Lina: Du hast doch in deiner Liste die Punkte für alle Springer, die vor der Saison 1993/1994 Punkte im WC gemacht haben, umgewandelt, oder?

Hast du da auch alle Plätze bis Platz 30 berücksichtigt und denen nach der heutigen Punkteregel die Punkte gutgeschrieben?

Hey, habe deinen Beitrag jetzt erst gesehen... :-(
Ich habe auch die Plätze 16-30 berücksichtigt, bis auf einige wenige Springen, zu denen man bisher nur lückenhafte Ergebnisse findet; das sind aber seit Weltcupbeginn nur noch 11 Springen, bei denen was fehlt.
(Siehe hier. )
 

Benjamin

Zahlenfreund
Beiträge
38.423
Punkte
113
Die Gesamtwertung ist fertig! :)
Ich habe den Startbeitrag entsprechend aktualisiert.
Sagt bescheid, falls ihr irgendwelche Fragen dazu habt! :)

Diskussionen bitte im Statistik-Talk. ;)
Hallo Lina, es sind ja durchaus ein paar Verschiebungen dabei, die ich erstaunlich finde. Besonders dass Severin Freund im Vergleich zu Peter Prevc und Stefan Kraft so deutlich von den Haltungsnoten profitiert hat, hat mich überrascht. Bei Ammann hingegen wundert der Abfall nicht wirklich.

Interessieren würden mich zwei Dinge: Erstens: Wieviel Zeit hat dich die Erstellung dieser Liste gekostet? Und zweitens: Was mich fast noch mehr interessieren würde als eine Saison ohne Haltungsnoten wäre eine Saison ohne Windpunkte. Du scheinst ja eine einigermaßen geschickte Möglichkeit gefunden zu haben, das aus den offiziellen PDFs zu extrahieren. Ob du auf sowas wohl auch noch Lust hättest...?
 

Lina_

Nachwuchsspieler
Beiträge
2.177
Punkte
48
Ort
Machteburch
Besonders dass Severin Freund im Vergleich zu Peter Prevc und Stefan Kraft so deutlich von den Haltungsnoten profitiert hat, hat mich überrascht. Bei Ammann hingegen wundert der Abfall nicht wirklich.
Bei den meisten dafür ausschlaggebenden Wettkämpfen waren die Punktunterschiede sehr gering, aber auch dann macht es eben zwischen Sieg und 2. Platz immernoch 20 Weltcuppunkte aus, da kommt schnell was zusammen...

Wer mich gar nicht überrascht hat war Vassiliev, der ganze 6 Ränge höher platziert ist als mit Noten. :D

Interessieren würden mich zwei Dinge: Erstens: Wieviel Zeit hat dich die Erstellung dieser Liste gekostet? Und zweitens: Was mich fast noch mehr interessieren würde als eine Saison ohne Haltungsnoten wäre eine Saison ohne Windpunkte. Du scheinst ja eine einigermaßen geschickte Möglichkeit gefunden zu haben, das aus den offiziellen PDFs zu extrahieren. Ob du auf sowas wohl auch noch Lust hättest...?
Die reine Arbeitszeit kann ich nicht genau sagen, ich habe halt über ein paar Wochen immermal zwischendurch was dran gemacht...
Für die letzten 10 Wettkämpfe und das Aufhübschen des Endergebnisses habe ich insgesamt ca. 3-4 Stunden gebraucht, die hatte ich am Stück gemacht.

Eine Saison ohne Windpunkte wäre vom Arbeitsaufwand her genau gleich.
Wenn ich aber direkt wieder die Saison 2014/15 nehme, wird es deutlich schneller gehen, da habe ich ja schon alle Ergebnisse in Tabellen und muss pro Wettkampf nur zwei Zellen ändern.
Ich glaube, ich fange gleich mal an. ;)
 

KoN

Bankspieler
Beiträge
1.723
Punkte
113
Hey, habe deinen Beitrag jetzt erst gesehen... :-(
Ich habe auch die Plätze 16-30 berücksichtigt, bis auf einige wenige Springen, zu denen man bisher nur lückenhafte Ergebnisse findet; das sind aber seit Weltcupbeginn nur noch 11 Springen, bei denen was fehlt.
(Siehe hier. )

Kein Problem, danke für die Antwort. ^^

Ja, dann werde ich das denke ich auch so machen, wenn tatsächlich nur so wenige Springen fehlen.

Deine Liste ist wirklich super und man sieht wieviel Arbeit du da rein gesteckt hast, meinen Respekt dafür.

Ich möchte für mich eine Excel-Datei erstellen, in der ich schnell nach allen möglichen Filtern mir Ergebnisse herausziehen / Ranglisten erstellen kann.

Auch haben mich die Statistiken von skijumping.pl zu den einzelnen Dekaden dazu inspiriert noch weitere Kategorien einfließen zu lassen.

Sobald ich die irgendwann fertig habe, werde ich auch wieder aktiver in diesem Unterforum werden. :)
 

Lina_

Nachwuchsspieler
Beiträge
2.177
Punkte
48
Ort
Machteburch
Ich möchte für mich eine Excel-Datei erstellen, in der ich schnell nach allen möglichen Filtern mir Ergebnisse herausziehen / Ranglisten erstellen kann.

Ich glaube, da machen wir gerade sehr ähnliche Dinge.
Wie im Planungsthread schon geschrieben, war das auch meine Absicht bei der Liste, nur hat sich Excel mit wachsender Größe als eher ungeeignet herausgestellt. Das Ganze wurde, zumindest mit meinen damaligen Excel-Kenntnissen, viel zu unhandlich und unübersichtlich.
(Wer sich besser mit Excel auskennt kann das aber sicherlich auch sehr viel besser und praktikabler hinkriegen als ich. ;) )
Das Filtern habe ich zwar direkt in Excel halbwegs hinbekommen, aber nur relativ umständlich. Was ich gar nicht hinbekommen habe, war, das Ganze so in den Tiefen des Internets zu präsentieren, dass ein Besucher selbst die Ergebnisse filtern und sortieren kann. (Also ohne sich die Excel-Datei runterladen und öffnen zu müssen).

Deswegen habe ich für meine Liste von Excel Abstand genommen und mich ins Thema Datenbanken & MS Access eingelesen und -arbeitet und bin mir sicher, dass eine Datenbank sich für so ein Projekt deutlich besser eignet, und sich nebenbei auch noch deutlich einfacher, detaillierter, übersichtlicher und vernünftig filterbar präsentieren lässt. :)
Inzwischen steht die Datenbankstruktur komplett und ich bin dabei, die Daten der einzelnen Springer und Schanzen einzutragen und zu ergänzen, damit bin ich jetzt geschätzt zu zwei Dritteln durch.
Von den Ergebnissen selbst muss ich dann zum Glück nur die letzten paar Saisons einzeln importieren, den Rest kann ich auf einen Schlag aus der (für diesen Zweck leicht umgestalteten) Excel-Liste importieren.

In der Datenbank sind folgende Eigenschaften mit erfasst, und entsprechend wird sie auch nach diesen Eigenschaften frei filterbar sein:
Springer:
Geschlecht (Ergebnisse der Damen und Herren können problemlos in der selben Datenbank stehen)
Vorname
Nachname
Geburtsdatum
Nationalität(en)
Verein
Größe (wenn bekannt)
aktiv (ja/nein)
verstorben (ja/nein)
falls verstorben, das entsprechende Jahr

Schanzen:
Ort (Nation, Stadt)
Name
Schanzentyp (Normal-, Groß- oder Flugschanze)
(aktueller) K-Punkt
(aktueller) Hillsize
Bauhjahr
Jahr des letzten Umbaus
stillgelegt (ja/nein)
abgerissen (ja/nein)

Wettkämpfe:
Datum
Art(en) des Wettkampfs (Weltcup, Vierschanzentournee, RawAir, WM, ...)
Schanze

Schanzenrekorde:
Springer
Schanze
Datum (bzw. Wettkampf)
Weite

An Ergebnissen trage ich erstmal nur Weltcuppunkte ein, an sich könnte man aber auch später ohne Probleme weitere Informationen ergänzen,
sowohl andere Wettkampfserien (also z.B. auch Damen-Weltcup, COCs, Sommer-GPs, WMs etc) als auch weitere Informationen in den Ergebnissen selbst (z.B. Weite, Punkte etc).
Aber alles zu seiner Zeit, jetzt sind erstmal die Herren-Weltcups dran.
 

KoN

Bankspieler
Beiträge
1.723
Punkte
113
Ich glaube, da machen wir gerade sehr ähnliche Dinge.
Wie im Planungsthread schon geschrieben, war das auch meine Absicht bei der Liste, nur hat sich Excel mit wachsender Größe als eher ungeeignet herausgestellt. Das Ganze wurde, zumindest mit meinen damaligen Excel-Kenntnissen, viel zu unhandlich und unübersichtlich.
(Wer sich besser mit Excel auskennt kann das aber sicherlich auch sehr viel besser und praktikabler hinkriegen als ich. ;) )
Das Filtern habe ich zwar direkt in Excel halbwegs hinbekommen, aber nur relativ umständlich. Was ich gar nicht hinbekommen habe, war, das Ganze so in den Tiefen des Internets zu präsentieren, dass ein Besucher selbst die Ergebnisse filtern und sortieren kann. (Also ohne sich die Excel-Datei runterladen und öffnen zu müssen).

Deswegen habe ich für meine Liste von Excel Abstand genommen und mich ins Thema Datenbanken & MS Access eingelesen und -arbeitet und bin mir sicher, dass eine Datenbank sich für so ein Projekt deutlich besser eignet, und sich nebenbei auch noch deutlich einfacher, detaillierter, übersichtlicher und vernünftig filterbar präsentieren lässt. :)
Inzwischen steht die Datenbankstruktur komplett und ich bin dabei, die Daten der einzelnen Springer und Schanzen einzutragen und zu ergänzen, damit bin ich jetzt geschätzt zu zwei Dritteln durch.
Von den Ergebnissen selbst muss ich dann zum Glück nur die letzten paar Saisons einzeln importieren, den Rest kann ich auf einen Schlag aus der (für diesen Zweck leicht umgestalteten) Excel-Liste importieren.

In der Datenbank sind folgende Eigenschaften mit erfasst, und entsprechend wird sie auch nach diesen Eigenschaften frei filterbar sein:
Springer:
Geschlecht (Ergebnisse der Damen und Herren können problemlos in der selben Datenbank stehen)
Vorname
Nachname
Geburtsdatum
Nationalität(en)
Verein
Größe (wenn bekannt)
aktiv (ja/nein)
verstorben (ja/nein)
falls verstorben, das entsprechende Jahr

Schanzen:
Ort (Nation, Stadt)
Name
Schanzentyp (Normal-, Groß- oder Flugschanze)
(aktueller) K-Punkt
(aktueller) Hillsize
Bauhjahr
Jahr des letzten Umbaus
stillgelegt (ja/nein)
abgerissen (ja/nein)

Wettkämpfe:
Datum
Art(en) des Wettkampfs (Weltcup, Vierschanzentournee, RawAir, WM, ...)
Schanze

Schanzenrekorde:
Springer
Schanze
Datum (bzw. Wettkampf)
Weite

An Ergebnissen trage ich erstmal nur Weltcuppunkte ein, an sich könnte man aber auch später ohne Probleme weitere Informationen ergänzen,
sowohl andere Wettkampfserien (also z.B. auch Damen-Weltcup, COCs, Sommer-GPs, WMs etc) als auch weitere Informationen in den Ergebnissen selbst (z.B. Weite, Punkte etc).
Aber alles zu seiner Zeit, jetzt sind erstmal die Herren-Weltcups dran.

Ah, genau so etwas wollte ich auch machen. Leider kenne ich mich mit Datenbanken usw. so gar nicht aus, daher bleibt mir wohl nur Excel. ^^"

Dann geht deine Liste ja sehr ins Detail. Gefühlt brauche ich dann hier ja nichts mehr posten. xD Wird dann ja alles von deiner Datenbank erschlagen.

Werde die Liste dann nur für mich erstellen.
 

Benjamin

Zahlenfreund
Beiträge
38.423
Punkte
113
Auf Youtube habe ich noch eine interessante Visualisierung der gesammelten Weltcuppunkte nach Nation gefunden. Mit dem kleinen Manko, dass die unterschiedlichen Punkteskalen vor und nach 1993 nicht berücksichtigt werden - aber dennoch sehenswert:

 
Oben