Inhaltsbereich

Statistik für Dummies

MeteoSchweiz-Blog | 03. Juli 2023
10 Kommentare

In Wettervorhersagen werden vermehrt Wahrscheinlichkeitsbegriffe verwendet, um die Statistik kommen wir also nicht herum. Wir stellen die wichtigsten Grundlagen vor.

  • Wetter

Fussbereich

Top Bar Navigation

Alle Schweizer BundesbehördenAlle Schweizer Bundesbehörden

Ist es Ihnen nicht auch schon so ergangen: In einer lockeren Runde wird an einem «Apéro» angenehm geplaudert. Die Erwähnung von «Mathematik, «Physik» oder gar «Stochastik» (Wahrscheinlichkeitsrechnung) beendet die Gesprächsrunde sofort bzw. treibt den Gesprächspartnern/Gesprächspartnerinnen den Angstschweiss auf die Stirn. Spätestens mit «Quantil», «Median» oder «Standardabweichung» haben Sie jegliches Gespräch abgewürgt … Es sei denn, Sie treffen auf die treue Leserschaft unseres Blogs. Dabei ist Mathematik eigentlich ganz einfach. Und geben Sie es zu: Wer von Ihnen hat zur Schulzeit nicht seinen Notendurchschnitt errechnet?

Es ist wahrscheinlich möglicherweise nicht ausgeschlossen, dass ...

Ihnen ist es sicher nicht entgangen: Die ehemals rein deterministische Wettervorhersage (es wird dieses oder jenes Wetter geben) wird mehr und mehr von Wahrscheinlichkeitsbegriffen wie z.B. «möglich», «wahrscheinlich», «nicht ausgeschlossen» usw. abgelöst. In Grafiken wird z.B. nicht nur ein (einzelner) deterministischer Temperaturwert sondern eine zu erwartende Temperaturspanne angegeben.

Wetter und Wahrscheinlichkeiten

Das Wetter über unseren Köpfen folgt einem wahrlich chaotischen System, dem Wettermodelle durch unzählige mathematische Formeln Herr werden möchten.

Grob vereinfacht funktioniert ein Wettermodell wie folgt: Mittels möglichst vielen Messdaten (Bodenmessungen, Radiosondierungen, Radar-/Satellitendaten ...) wird der Ausgangszustand der Atmosphäre bestimmt und das Wettermodell mit diesen Daten gestartet. Das Wettermodell berechnet anschliessend das zu erwartende Wetter für die kommenden Tage. Soweit so gut, wir haben es mit einer Lösung, also einer deterministischen Vorhersage zu tun.

Zurück zu unserem chaotischen Wetter: Es liegt auf der Hand, dass trotz allem Aufwand der Ausgangszustand des Wetters nie komplett durch Messungen erfasst werden kann. Schon beim Start unseres Wettermodells sind Unsicherheiten vorhanden, die sich mit der Vorhersagezeit «fortpflanzen».

Die Unsicherheiten in der Wettervorhersage werden mit der Ensemble-Methode abgeschätzt. Das Modell wird mit jeweils leicht variierten Anfangsbedingungen mehrmals gerechnet. Jede Modellrechnung liefert eine Wetterprognose, genauer ein «Mitglied» oder «Member». Anschliessend werden alle «Members» miteinander verglichen und beurteilt. Hier kommt die Wahrscheinlichkeitsrechnung zum Einsatz. Wir stellen die wichtigsten Begriffe wie «Mittelwert», «Median», «Quantil» vor.

Definition der Begriffe

Mehrmals täglich erstellt das EZMWF IFS-Modell 51 10-Tagesvorhersagen, wobei es die Anfangsbedingungen leicht verändert. Diese 51 Vorhersagen nennt man wie oben beschrieben «Mitglieder» oder «Member».

Für einen beliebigen Ort schauen wir uns im Folgenden die vorhergesagte 24-stündige Niederschlagsmenge für einen bestimmten Tag an. Nehmen wir nun an, dass die Verteilung des Niederschlags nach den verschiedenen «Members» wie folgt aussieht (sie ist zum besseren Verständnis etwas idealisiert):

Wir erkennen, dass die Niederschlags-Verteilung gleichmässig und symmetrisch um den Maximalwert von 26 mm, der durch «Member» Nr. 26 dargestellt wird, verläuft.

Um die verschiedenen statistischen Begriffe besser zu veranschaulichen, ist es hilfreich, zunächst die Werte der einzelnen "Member" in aufsteigender Reihenfolge zu ordnen (man nennt dies eine "kumulative Verteilungsfunktion"), was zu der folgenden Darstellung führt. Wir sehen, dass jeder Wert zweimal dargestellt ist und der Maximalwert (kommt nur einmal vor, siehe obige Grafik) 26 mm beträgt:

Basierend auf der exemplarischen Niederschlagsverteilung der 51 "Members" kommen wir jetzt zu den wichtigsten statistischen Begriffen:

  • Der Mittelwert (oder Durchschnitt) ist der einfachste Begriff. Er wird ermittelt, indem der Wert aller Mitglieder addiert und dann durch die Anzahl der Mitglieder geteilt wird. Es handelt sich also um einen einzelnen Wert, dessen Repräsentativität in Bezug auf die Gesamtheit stark variieren kann (vgl. Standardabweichung).  In der obigen Verteilung beträgt der Mittelwert 13 mm und wird durch das «Member» Nr. 26 (in rot) repräsentiert.
  • Die Standardabweichung (engl. "Standard Deviation") misst die Streuung der Werte um den Mittelwert. Im Grunde sagt sie uns, wie repräsentativ der Mittelwert für die Stichprobe ist. Je kleiner die Standardabweichung, desto aussagekräftiger ist der Mittelwert. In der obigen Verteilung beträgt die Standardabweichung 7,4 mm, was bedeutet, dass der Mittelwert von 13 mm nicht sehr repräsentativ für die Gesamtheit ist. Allgemein kann gesagt werden, dass die Vorhersage weniger sicher ist, je größer die Standardabweichung ist.
  • Der Median ist der Wert, der die Stichprobe genau in zwei Hälften teilt, nämlich in eine Hälfte der Mitglieder mit mehr Niederschlag und die andere Hälfte mit weniger Niederschlag. Da die Verteilung in diesem Beispiel symmetrisch ist, entspricht der Median dem Mittelwert und wird auch in der obigen Grafik durch das «Member» Nr. 26 mit 13 mm (in rot) dargestellt. Wenn die Verteilung nicht symmetrisch ist, sind Mittelwert und Median in der Regel nicht deckungsgleich.
  • Quantile sind (meist standardisierte) Prozentwerte, die eine bestimmte Anzahl von Mitgliedern zusammenfassen. Beispielsweise sagt uns das 75%-Quantil (dargestellt durch «Member»  Nr. 38 (gelb), 19 mm in unserem Beispiel), dass 75% der «Members» weniger als 19 mm erwarten und 25% der «Members»  mehr als 19 mm simulieren. Beachten Sie, dass der Median nichts anderes als das 50 %-Quantil ist; das 0 %-Quantil steht für die Prognose mit dem geringsten Niederschlag und das 100 %-Quantil für das entgegengesetzte Extrem.
  • Aus den «Members» lassen sich Wahrscheinlichkeiten für die Über-/Unterschreitung vordefinierter Schwellwerte berechnen. Wahrscheinlichkeiten werden bei MeteoSchweiz v.a. bei Warnungen verwendet.

Konkrete Beispiele

Natürlich ist in der Realität die Niederschlagsverteilung nie symmetrisch. Für unsere Beispielgemeinde sieht die Niederschlagsverteilung beispielsweise wie in der folgenden Grafik aus. Sehr viele «Members» simulieren keinen Niederschlag, wenige «Members» ergeben sehr viel Niederschlag:

  • Mittelwert: 9 mm (in rot).
  • Standardabweichung: 19 mm
  • Median («Member» Nr. 26): 0 mm
  • 75 %-Quantile: 3 mm (in Gelb).

In diesem Beispiel erkennen wir sofort, dass der Mittelwert von 9 mm nicht repräsentativ ist, da die grosse Mehrheit der «Members» keinen Niederschlag vorhersagen (die Standardabweichung ist übrigens sehr gross). Wir erkennen auch, dass der Median und der Mittelwert nicht denselben Wert haben, da die Verteilung der «Members» nicht symmetrisch ist. In diesem Fall gibt der Median - mit dem Wert 0 mm - einen nützlichen Hinweis, da er für die grosse Mehrheit der «Members» identisch ist.

Der Wert von 3 mm für das 75 %-Quantil zeigt an, dass nur 25 % der "Members" mehr als 3 mm Niederschlag vorsehen. Daraus lässt sich schliessen, dass es sehr wahrscheinlich ist, dass die Beispiel-Gemeinde keinen oder nur sehr wenig Niederschlag erhält. Aber 70 mm Niederschlag sind ebenfalls nicht völlig ausgeschlossen.

Folgendes Beispiel zeigt die «fiktive» Niederschlagsverteilung unserer 51 «Members» beim Durchzug einer quasi-stationären Front:

  • Mittelwert: 28 mm (dargestellt durch «Member» Nr. 29 in rot).
  • Standardabweichung: 12 mm
  • Median: 25 mm (in schwarz).
  • 75%-Quantil: 37 mm (in gelb)

In einer Situation wie dieser ist die Wahrscheinlichkeit von Niederschlägen sehr hoch, aber es besteht eine ziemlich grosse Unsicherheit bezüglich der genauen Summen, da die Differenz zwischen den beiden Extremen mehr als 40 mm beträgt. Die Standardabweichung ist mit 12 mm übrigens signifikant. Die Verteilung ist ziemlich symmetrisch, Mittelwert und Median liegen sehr nahe beieinander. In solch einem Beispiel wäre mit voraussichtlich 20 bis 30 mm Niederschlag zu rechnen.

Verwendung von Wahrscheinlichkeiten bei MeteoSchweiz

Schauen wir uns anhand der verschiedenen erwähnten statistischen Begriffe an, wie die Prognose des COSMO-2E-Modells mit 21 «Members» für die 24-stündige Regensumme zwischen Dienstag, 4. Juli, und Mittwoch, 5. Juli, um 18 UTC aussieht.

Für Niederschlagsvorhersagen ist der Mittelwert uninteressant, da er immer ungleich Null ist, sobald Niederschlag vorhanden ist, und sei es auch nur in einem einzigen Mitglied; er wird daher nicht verwendet. Die Standardabweichung hingegen ist wichtig, da sie uns einen Hinweis auf die Zuverlässigkeit der Vorhersage gibt.

Die 21 «Members»

Es handelt sich um 21 verschiedene Prognosen für denselben Termin und denselben Parameter, ausgehend von leicht veränderten Anfangsbedingungen:

Der Median

Die Standardabweichung

Die Karte der Standardabweichung zeigt uns, dass die erwarteten Mengen in der Zentralschweiz und dem angrenzenden Glarnerland sowie im Tessin inkl. Misox/Calancatal sehr unsicher sind, je nach Region zwischen plus oder minus 5 und 20 mm.

Die Quantile

Die Wahrscheinlichkeiten

In Gewittersituationen sind die Wahrscheinlichkeiten im Allgemeinen gering, da die recht zufällige Verteilung der Niederschläge es unwahrscheinlich macht, dass es in allen "Members" des Ensembles zu grossen Niederschlagsmengen am selben Ort kommt.

Wahrscheinlichkeiten an einem Punkt

Für einen vorgegebenen Punkt (hier Aigle, VS) sehen die Wahrscheinlichkeiten wie unten dargestellt aus. Die Quantile 0 und 100 % werden durch vertikale Balken, die Quantile 90-75 % und 10-25 % durch schmale hellblaue Rechtecke, das Quantil 25-75 % durch ein breites dunkelblaues Rechteck und der Median durch eine horizontale schwarze Linie dargestellt. Generell gilt: Je breiter die blaue "Box", desto größer die Streuung und desto unsicherer die Prognose.

An diesem Beispiel sehen wir, dass sich das Niederschlagsrisiko in 6-Stunden-Schritten verändert. Für Aigle ist es in der Nacht von Dienstag auf Mittwoch von 18-00 und 00-06 UTC am höchsten. Für den Zeitabschnitt 00-06 UTC ergeben das 100 %-Quantil 6 mm, das 90 %-Quantil 4 mm, das 75 %-Quantil 1 mm und der Median 0.01 mm.

Schlussfolgerung

Während die «Members» der Ensemble-Prognose eine hohe meteorologische Konsistenz aufweisen, da sie einem bestimmten Szenario folgen, gilt dies nicht für die abgeleiteten Werte wie Median, Quantil usw.

Beispielsweise zeigt die Karte des 100 %-Quantils des Niederschlags für jeden Pixel den höchsten Niederschlagswert, unabhängig von den meteorologischen Szenarien, die diesen Wert verursachen. So ist das Szenario, welches den maximalen Niederschlag in Genf hervorbringt, nicht unbedingt dasselbe wie jenes, das den maximalen Niederschlag in Zürich hervorbringt. Und doch sind beide auf derselben Karte zu sehen; dasselbe gilt für den Mittelwert oder die Standardabweichung.

Wie wir sehen, sind Wahrscheinlichkeiten ein sehr wichtiger Ansatz für moderne Wettervorhersagen. Aber sie entfalten ihr volles Potenzial nur, wenn sie mit klassischen Ansätzen wie z.B. Klimatologie, menschlicher Erfahrung (Kenntnis des Geländes sowie der Stärken und Schwächen der verschiedenen Modelle) gekoppelt werden. Hier kommen wir Prognostikerinnen und Prognostiker ins Spiel …