WM durch die Statistik-Brille betrachtet

Die Gleitschirm-WM im kolumbianischen Roldanillo im Januar 2015 gilt als einer der erfolgreichsten Wettbewerbe aller Zeiten: Zehn geflogene Tasks in der Wertung, mehr als 800 Kilometer summiert geflogene Strecke über alle Tasks, fast 24 Stunden kumulierte Flugzeit pro Pilot. Nimmt man die Ergebnisse der einzelnen Tasks und für die 144 beteiligten Piloten sowie die Nationen, so stellt das einen großen Datensatz dar, den man auch einmal guten Gewissens einer statistischen Analyse unterwerfen kann.

Das dachte sich auch Andreas Pfeiffer. Er ist nicht nur begeisterter Gleitschirmpilot, sondern auch Diplompsychologe an der Universität Koblenz-Landau. In seinem Job hat er viel mit Daten und Statistik zu tun. Und so nutzte er dieses Wissen und die passende Software, um einmal die WM im Rückblick durch die Stastistik-Brille zu betrachten. Ihn beschäftigten Fragen wie: Wie erfolgreich waren die Schirmmodelle im Vergleich? Stimmt es, dass größere Schirme einen Vorteil haben? Welche Piloten und Nationen punkteten relativ gesehen am konstantesten?

Um Antworten zu erhalten, übertrug er die Ergebnistabellen der WM in die Open Source Statistiksoftware R und erstellte mit Hilfe des Visulisierungspakets ggplot2 passende Grafiken. Die interessantesten davon stellte er lu-glidz freundlicherweise zur Verfügung. Sie sind im folgenden dokumentiert. (Um einzelne Grafiken etwas größer betrachten zu können, einfach mit der Maus darauf klicken).


Welcher Schirm flog am erfolgreichsten?
Vor der WM war die Spannung groß: Wie würden sich die neuen CCC-Konkurrenzmodelle Gin Boomerang 10 und Niviuk Icepeak 8 im Vergleich zum bislang dominierenden Ozone Enzo 2 schlagen? Schon von den Ergebnissen und den Pilotenberichten her erschien es so, als seien zumindest Enzo 2 und Boomerang 10 leistungsmäßig ebenbürtig, während die Icepeaks der verschiedenen Generationen nicht ganz mithalten konnten. Tatsächlich spiegelt sich diese Wahrnehmung auch in der statistischen Auswertung wieder.

Interpretationshilfe: Die Grafik zeigt ein bei statistischen Auswertungen gerne genutztes, sogenanntes Box-Plot. Dafür wurden jeweils alle mit einem Schirmmodell erflogenen Task-Punkte miteinander verrechnet. Der schwarze Punkt in jeder Box stellt den rechnerischen Mittelwert dar. Der schwarze Querstrich in der Box kennzeichnet den sogenannten Median. Das heißt: Genau 50% aller Ergebnisse in der Wertung je Schirmmodell liegen über, 50% unter diesem Punktewert. Zugleich teilt der Median die Box in ein oberes und ein unteres Quartil. Diese umfassen jeweils ein Viertel der "Messwerte", die über und unter dem Median liegen. Diese Darstellung liefert einen guten Eindruck über die Streuung der zentralen Masse der Ergebnisse. Man könnte dies auch als die Leistungsdichte der Piloten interpretieren, die mit den jeweiligen Modellen im Wettbewerb flogen.

Bei jeder Statistik sollte man mit der Interpretation vorsichtig sein und stets beachten, auf welcher Datengrundlage sie beruht. Diese Warnung betrifft in diesem Fall vor allem die Ergebnisse für die drei Icepeak-Modelle von Niviuk. Bei der WM waren sie deutlich seltener vertreten als Enzo 2 und Boom 10. Das zeigt sich eindrücklich, wenn man im Boxplot alle zugehörigen Datenpunkte mit darstellt. Durch die kleinere Datengrundlage sind die Ergebnisse weniger repräsentativ. Die wahre Leistungsfähigkeit eines Icepeak 8 könnte also unterschätzt sein. Zumal nur wenige Spitzenpiloten bei der WM auf dieses Modell setzten. Entsprechend stärker könnten Mittelwert und Median auch von weniger erfahrenen IP8-Piloten nach unten gezogen worden sein.


Bieten größere Schirme einen Vorteil?
Es ist eine alte Weisheit von Wettbewerbspiloten: Große Schirmgrößen "gehen" besser. Aber trifft das auch auf moderne Wettbewerbsschirme zu? Die statistische Auswertung der Taskergebnisse der WM lassen diesen Schluss durchaus zu. Allerdings ist der Vorsprung der L- und M-Schirme gegenüber den S- und XS-Schirmen vermutlich etwas überbewertet. Die kleineren Schirmgrößen werden u.a. von den weiblichen Piloten geflogen, die seltener einen harten Racing-Flugstil an den Tag legen wie viele  männliche Kollegen. Zudem werden die kleineren Schirmgrößen typischerweise mit geringerer Flächenbelastung geflogen. Damit haben die Piloten Nachteile im Speed, was sich auch in der Zuteilung von Führungs- und Zeitpunkten bemerkbar machen kann.


Welcher Pilot flog am konstantesten?
Diese Grafik zeigt die Entwicklung der Task-Ergebnisse der zehn Piloten, die am Ende die Top 10 bildeten. Um die Pilotenleistungen untereinander von Task zu Task besser vergleichbar zu machen, sind die Werte standardisiert. Für jeden Tag ist die tatsächlich erflogende Punktezahl des jeweiligen Tagessiegers als 100 Prozent gewertet, die einzelnen Pilotenergebnisse sind entsprechend umgerechnet. D.h. dass zum Beispiel der Task 10, bei dem wegen großer Abschattungen niemand das Goal erreichte, mit der gleichen Gewichtung angezeigt wird wie die anderen. In dieser Darstellung wird deutlich, warum Honorin Hamard verdient Weltmeister wurde. Außer in einem Task, der letztendlich aus der Punktewertung herausfiel, flog er am beständigsten ganz vorne mit. Betrachtet man allerdings die Kurven über alle 10 Tasks hinweg, so punkteten Torsten Siegel und Heli Eichholzer am konstantesten. Gäbe es keine Streichresultate in der Wertung, trüge der Weltmeister 2015 einen anderen Namen.
Anmerkung: An den Tagen wie z.B. Task 7, an denen keine der dargestellten Leistungskurven die 100% Marke erreicht, gewannen jeweils Piloten den Task, die am Ende nicht in der Top 10 waren.


Welches Nationalteam flog am beständigsten?
Auch diese Grafik setzt auf eine "standardisierte" Darstellung. Die Punktzahl des besten Teams pro Tag wird als 100 dargestellt, die anderen Teams relativ dazu gewertet. In dieser Darstellung wird deutlich, wie die Schweizer in den Tasks 6 und 7 einen Einbruch erlebten, der ihnen letztendlich einen Platz unter den Top 3 kostete. Auch Frankreich konnte erst in der zweiten Hälfte des Bewerbs seiner Favoritenrolle als Mannschaft gerecht werden, was allerdings nicht mehr für einen Platz auf dem Podium reichte. Insgesamt zeigt sich beim deutschen Team im Verhältnis zu den anderen Mannschaften das geringste Auf- und Ab. Der Team-Weltmeistertitel ist also durchaus verdient.
Share on Google Plus

3 Kommentare:

Philipp Bethge hat gesagt…

Sehr schön, vielen Dank!

Torsten hat gesagt…

Hallo Lucian,

danke für den sehr interessanten Beitrag. Kleine Anmerkung dazu: der Median teilt die Box in ein oberes und unteres Quantil/Quartil. Soweit klar. Wenn du aber nur 2 Quartile zulässt muss der Strich die obere von der unteren Hälfte trennen, nicht das obere vom unteren Viertel. Andernfalls hättest du das 25%-Quartil heranziehen müssen.
Wie auch immer, danke für nochmal für die Auswertung!

Torsten

Anonym hat gesagt…

Bitte um eine Neuauflage zum PWC Superfinale