Edilbert Kirk und Klaus Fraedrich
Zusammenfassung
Verschiedene statistische Modelle zur Prognose der Niederschlagswahrscheinlichkeit werden vorgestellt und am Beispiel der Station Hamburg-Fuhlsbüttel verifiziert. Die Niederschlagswahrscheinlichkeit kann für einen Vorhersagezeitraum von bis zu 24 Stunden mit diesen einfachen Modellen gut vorhergesagt werden. Dabei liefert die größte Vorhersagegüte eine Kombination von Markovketten und multivariater, linearer Regression. Als Prediktoren werden die Parameter eines Standardsynops verwendet.
Inhalt
1 Einführung
Die Vorhersage der Niederschlagswahrscheinlichkeit ist jetzt zu einem festen Bestandteil der täglichen Wettervorhersage in der Presse und im Rundfunk geworden. Sie ist jedoch nicht unproblematisch, da es erstens an einer einheitlichen Definition der Niederschlagswahrscheinlichkeit fehlt, und sie außerdem in der Regel nur ein subjektiver Schätzwert des beratenden Meteorologen darstellt. Auch wird die Wahrscheinlichkeit oft mit einer räumlichen oder zeitlichen Häufigkeitsverteilung verwechselt. In dieser Arbeit werden eine Definition der Niederschlagswahrscheinlichkeit gegeben und Verfahren zu ihrer objektiven Berechnung vorgestellt. Diese Verfahren sind für den operationellen Einsatz mit geringem technischen Aufwand (Workstations oder PCs) geeignet. Mittels unabhängiger Modellbildungs- und Testdaten können sie für jede beliebige Wetterstation mit ausreichend langer Datenreihe (mehr als 10 Jahre) benutzt werden. Die Anwendung auf das Gebiet von Deutschland kann z. B. im Internet auf der folgenden Seite eingesehen werden: "http://mi.uni-hamburg.de/vorhersagen/".
2 Definitionen: Niederschlagsereignis und Niederschlagswahrscheinlichkeit
In bisherigen Arbeiten zur Vorhersage der Niederschlagswahrscheinlichkeit (z. B. Fraedrich and Leslie, 1987) wird ein Niederschlagsereignis meist durch eine Mindestmenge (typisch 2 mm) Wasser im Regenmesser der Meßstation definiert worden. In dieser Arbeit ist ein Niederschlagsereignis dadurch definiert, daß zu einem Synop- Haupttermin (00,06,12 und 18 Uhr GMT) der Wert W1 (bzw. in alten Daten W) einer Wettermeldung einen Wert von 5 bis 9 aufweist. Zu diesen Hauptterminen wird im Synopwert W1 die vorwiegende Wettererscheinung der letzten 6 Stunden vor der Beobachtung kodiert. Der seltene Fall - Gewitter ohne Niederschlag - wird hier nicht gesondert behandelt, da er statistisch ohne Bedeutung ist.
| WMO Code W1 | Erläuterung | Niederschlags- ereignis |
| 0 | Gesamtbedeckung ständig unter 50% | - |
| 1 | Gesamtbedeckung wechselnd | - |
| 2 | Gesamtbedeckung ständig über 50% | - |
| 3 | Staub/Sandsturm, oder Schneetreiben | - |
| 4 | Nebel, Dunst oder Rauch mit Sichtweite < 1 km | - |
| 5 | Niesel | ja |
| 6 | Regen | ja |
| 7 | Schnee oder Schneeregen | ja |
| 8 | Schauer | ja |
| 9 | Gewitter | ja |
Tabelle 1: Verknüpfung des Niederschlagsereignisses mit dem WMO-Synop-Code W1
Alle Werte von W1 zwischen 5 und 9 werden somit als Niederschlagsereignisse gewertet. Der Vorteil gegenüber der Regenmesserdefinition liegt in einer konstanten zeitlichen Auflösung von 6 Stunden (auch in alten Daten), während die Regenmengen in alten Datensätzen in der Regel nur für 12- oder gar 24-stündige Intervalle vorliegen.
Das führt zu folgender Definition der Niederschlagswahrscheinlichkeit:
Im Vorhersagezeitraum tritt mindestens einmal ein Niederschlagsereignis auf, welches im Synop des nächsten Haupttermins durch eine Kodierung des Parameters W1 im Bereich 5 bis 9 angezeigt wird. Bei einem Vorhersagezeitraum von 6 bis 18 Uhr ist das Ereignis also eingetreten, wenn im 12-Uhr- oder 18-Uhr-Synop ein W1 > 4 gemeldet wird.
3 Daten
Für die Erstellung und Verifikation der Modelle werden hier die Daten von drei Stationen mit sehr unterschiedlichen Klimaten der mittleren Breiten vorgestellt. Melbourne repräsentiert ein sehr trockenes Klima mit einer klimatischen Niederschlagswahrscheinlichkeit von 14% für 12 Stunden. Bergen als eine der regenreichsten Stationen Europas stellt das andere Extrem dar, mit einer klimatischen Wahrscheinlichkeit von 58%. Hamburg-Fuhlsbüttel schließlich besitzt den für Wahrscheinlichkeitsvorhersagen ungünstigsten Wert von 50%. Da die Vorhersage für Hamburg am schwierigsten ist, und für diese Station die längste Datenreihe vorlag, werden die meisten Ergebnisse für die Station Hamburg-Fuhlsbüttel präsentiert. Für die Station Hamburg-Fuhlsbüttel liegt ein Datensatz von 1949 - 1995 vor. Dieser wurde in einen Eichdatensatz (1949 - 1978) und einen Testdatensatz (1979 - 1995) geteilt, um die Modelle an einem unabhängigen Datensatz testen zu können. Alle in dieser Arbeit vorgestellten Ergebnisse und Maßzahlen beziehen sich auf die Verifikation mit dem Testdatensatz. Für Bergen wird der Eichdatensatz 1957 - 1985 und der Testdatensatz 1986 - 1993 verwendet, für Melbourne gilt für die Eichung 1960 - 1977 und für den Test 1978 - 1988.
4 Modelle zur Vorhersage der Niederschlagswahrscheinlichkeit
Sechs Modelle zur Wahrscheinlichkeitsvorhersage werden vorgestellt. Bei den ersten beiden, Persistenz und Klima, handelt es sich um Referenzmodelle, die zur Bewertung der Prognosen komplexer Modelle herangezogen werden. Mit den anderen vier Modellen bilden sie eine Hierarchie wachsender Komplexität und Güte. Nach der Modellbildung mit dem Eichdatensatz erfolgt die Verifikation mit dem Testdatensatz nach folgendem Schema: Für jeden Termin des unabhängigen Testdatensatzes wird eine Modellvorhersage für den Zeitraum der jeweils nächsten 12 Stunden gemacht und mit den eingetreten Niederschlagsereignissen verglichen. Hierbei ist es wichtig festzustellen, daß eine Wahrscheinlichkeitsvorhersage aus einem kontinuierlichen Wertebereich von 0 bis 1 (bzw. 0% bis 100%) mit einem binären Ereignis 0 oder 1 verglichen wird. Hohe Bewertungen können also nur bei einer Häufung richtiger Vorhersagen bei 0 und 1 eintreten.
4.1 Persistenz
Das einfachste Modell zur Vorhersage von Niederschlag ist die Persistenz. Für die Niederschlagswahrscheinlichkeit bedeutet dies immer eine Prognose von 100%, wenn es während des Starttermins der Vorhersage oder kurz zuvor geregnet hat, und andernfalls 0%. Trotz des sehr einfachen Ansatzes ist dieses Modell schon besser als eine Zufallsvorhersage und wird deshalb meist als Referenz benutzt, um daran die Vorhersagegüte des eigentlichen Modells bzw. der Meteorologen vom Dienst zu testen (siehe z. B. Fraedrich and Leslie, 1987). Nur Prognosen, welche besser als die Persistenz sind, haben eine Güte (Skill) in der Vorhersage zeitlicher Veränderungen.
4.2 Klima
Die Vorhersage mit dem Klimamittel gewinnt man durch die mittlere monatliche Häufigkeit von Niederschlagsintervallen aus den Beobachtungen vorangegangener Jahre. Das Klima-Modell sagt die mittlere Regenwahrscheinlichkeit abhängig vom aktuellen Monat und Intervall vorher. Es wird also unabhängig vom aktuellen Wettergeschehen während eines Monats immer der gleiche Wert vorhergesagt. Die Tabelle 2 zeigt die klimatischen Wahrscheinlichkeiten für einen Vorhersagezeitraum von 12 Stunden für die Stationen Bergen, Hamburg und Melbourne.
| Zeitraum | Bergen | Hamburg | Melbourne |
| Januar | 63 | 58 | 9 |
| Februar | 57 | 53 | 8 |
| März | 54 | 46 | 10 |
| April | 56 | 47 | 13 |
| Mai | 49 | 46 | 16 |
| Juni | 48 | 41 | 14 |
| Juli | 53 | 49 | 15 |
| August | 59 | 45 | 18 |
| September | 65 | 45 | 14 |
| Oktober | 67 | 45 | 14 |
| November | 65 | 56 | 13 |
| Dezember | 65 | 58 | 12 |
| Winter | 62 | 57 | 10 |
| Frühling | 53 | 46 | 13 |
| Sommer | 54 | 45 | 16 |
| Herbst | 66 | 48 | 14 |
| Jahr | 58 | 49 | 13 |
Tabelle 2: Klimatische Regenwahrscheinlichkeit für 12-stündige Zeiträume [%].
4.3 Markov
Das Markovmodell basiert auf der Annahme, daß sich der Wechsel zwischen Klassen durch Markovketten beschreiben läßt (Fraedrich und Müller, 1983). In bisherigen Arbeiten zur Vorhersage von Niederschlagswahrscheinlichkeiten mit Markovketten wurde zur Klassenbildung meist die Gesamtbedeckung (Fraedrich und Müller, 1983), oder eine Kombination aus Gesamtbedeckung und Taupunkt (Fraedrich and Leslie, 1987) benutzt. Für die vorliegende Arbeit wurden Tests mit einer Vielzahl von synoptischen Parametern durchgeführt, die zu dem Ergebnis führten, daß eine Kombination aus der aktuellen Wettererscheinung zur Zeit der Beobachtung und dem Typ der niedrigen Wolken der am besten geeignete Klassifizierungsparameter ist. Deshalb wird eine Klassifizierung der Wetterzustände in drei sich ausschließende Klassen folgendermaßen vorgenommen:
| Klasse | Definition nach ww-Synopcode |
| Regen | Meldung von 14 bis 17, 20 bis 29 oder 50 bis 99 |
| Stratus | Kein Niederschlag und Typ der niedrigen Wolken zwischen 5 und 9 |
| Cumulus | Alle Zustände, die nicht zur Klasse Regen oder Stratus gehören |
Tabelle 3: Definition der Markovklassen
Die Markovketten 1. Ordnung liefern dann die Matrizen der Übergangswahrscheinlichkeiten:
| Bergen | Klima | Cumulus | Stratus | Regen |
| Cumulus | 28% | 66 % | 24 % | 10 % |
| Stratus | 34% | 19 % | 50 % | 31 % |
| Regen | 38% | 7 % | 29 % | 64 % |
| Hamburg | Klima | Cumulus | Stratus | Regen |
| Cumulus | 35% | 62 % | 27 % | 11 % |
| Stratus | 41% | 24 % | 53 % | 23 % |
| Regen | 24% | 13 % | 41 % | 46 % |
| Melbourne | Klima | Cumulus | Stratus | Regen |
| Cumulus | 62% | 81 % | 8 % | 11 % |
| Stratus | 19% | 38 % | 46 % | 16 % |
| Regen | 19% | 38 % | 14 % | 48 % |
Tabelle 4: Übergangswahrscheinlichkeiten für 6-Stunden-Intervalle
Diese Matrizen zeigen in der Spalte Klima die beobachtete Häufigkeit dieser Klasse im Testdatensatz. Die übrigen 3 Elemente jeder Zeile zeigen die Wahrscheinlichkeit eines Verweilens bzw. eines Übergangs in eine andere Klasse während eines zukünftigen 6-Stunden-Intervalls. Für alle Stationen ist die Wahrscheinlichkeit eines Verweilens in einer Klasse höher als die eines Übergangs in eine andere. Außerdem zeigen die geringen Wahrscheinlichkeiten für die Übergänge Cumulus-Regen und Regen-Cumulus, daß der Wechsel zwischen diesen Klassen meist über die Stratus-Klasse erfolgt. Eine Verdoppelung des Vorhersagezeitraums kann durch eine Quadratur der Übergangsmatrix erreicht werden. Ebenso kann durch weitere Potenzierung der Vorhersagezeitraum noch weiter ausgedehnt werden. Für wachsende Exponenten nähert sich die potenzierte Matrix aber einer Matrix der Klimawahrscheinlichkeit an, in der die Vorhersage nicht mehr vom Ausgangszustand abhängt und somit die Grenze der Vorhersagbarkeit aufzeigt.
Abb. 1: Markov-Vorhersage für verschiedene Zeiträume
In Abbildung 1 wird die Markov-Regenwahrscheinlichkeit der Station Hamburg-Fuhlsbüttel für verschieden lange Vorhersagezeiträume gezeigt. Daraus ist abzusehen, daß dieses Verfahren nur für einen Zeitraum von 6 oder 12 Stunden sinnvoll anzuwenden ist. In diesem Bereich ist es auch deutlich besser als die Persistenz- oder Klimavorhersage (Tabelle 7). Für längere Zeiträume nähern sich alle drei Kurven der Klimawahrscheinlichkeit der Regenklasse (24% für 6-Stunden Intervalle in Hamburg).
4.4 Univariate Regression
Das univariate Regressionsmodell kombiniert eine lineare Regression mit der Markovkette. Hierzu wird für jede Markovklasse getrennt eine Regression durchgeführt mit einem beliebigen Synop-Parameter als Prediktor. Als Ergebnis erhält man für jede Markovklasse eine Regressionsgerade, die zur Vorhersage verwendet wird. Für die Station Hamburg-Fuhlsbüttel stellte sich der Bodendruck als der beste Prediktor heraus. Führt man die Regression außerdem noch getrennt für die vier Jahreszeiten durch, so ergibt sich ein Modell, welches dem reinen Markovmodell hoch überlegen ist (Tabelle 6). Ein Vorteil dieses Modells liegt darin, daß es graphisch darstellbar und damit leicht anwendbar ist. Abbildung 2 zeigt dieses Modell für die Stationen Bergen, Hamburg und Melbourne. Für die Vorhersage reicht hier die Kenntnis des Bodendrucks und der Klasse, um den Vorhersagewert an der entsprechenden Geraden abzulesen.
Abb. 2: Markov/Druck Modelle für Bergen, Hamburg und Melbourne
4.5 Multivariate Regression
Das multivariate Regressionsmodell bezieht eine beliebige Zahl lokaler Covariaten in die Regression mit ein. Da der Einfluß der synoptischen Größen sehr stark von Station zu Station variiert, muß entweder für jede Station eine Voruntersuchung die Auswahl der wichtigsten Parameter bestimmt werden, oder der gesamte Satz an Parametern wird benutzt, auch wenn einzelne Regressionskoeffizienten nahe Null sind. Für die Testdatensätze wird für jede einzelne Vorhersage der Beitrag aller Covariaten, also das Produkt aus Meßwert und Regressionskoeffizient, bestimmt. Daraus lassen sich die mittleren quadratischen Beiträge berechnen, um eine Rangfolge der Covariaten aufzustellen. Eine detaillierte qualitative Auswertung ist aber hier nicht sinnvoll, da der Einfluß dieser Covariaten je nach Zusammenstellung stark variiert, denn es handelt sich nicht um unabhängige Variablen. Der Vergleich der drei Stationen Hamburg, Melbourne und Bergen läßt jedoch große Unterschiede hervortreten, wie die Tabelle 5 zeigt:
| Station | Bergen | Hamburg | Melbourne |
| 1. Parameter | Tiefe Wolken | Gesamtbedeckung | Gesamtbedeckung |
| 2. Parameter | Gesamtbedeckung | Tiefe Wolken | Sicht |
| 3. Parameter | Wolkenuntergrenze | Druck | Druck |
| 4. Parameter | Meridionalwind | Temperatur | Temperatur |
Tabelle 5: Covariaten-Einfluß
Die Gesamtbedeckung ist der einzige Parameter, der bei allen drei Stationen eine wichtige Rolle spielt. Typisch für lokale Einflüsse sind dagegen die Sicht in Melbourne oder der Meridionalwind in Bergen.
Führt man die Regressionen saisonal getrennt durch, ergibt sich für Hamburg folgende Tabelle:
| Hamburg | Winter | Frühling | Sommer | Herbst |
| 1. Parameter | Bedeckung | Bedeckung | Bedeckung | Bedeckung |
| 2. Parameter | Tiefe Wolken | Tiefe Wolken | Druck | Tiefe Wolken |
| 3. Parameter | Druck | Druck | Meridionalwind | Druck |
| 4. Parameter | Zonalwind | Temperatur | Mittelhohe Wolken | Zonalwind |
Tabelle 6: Saisonaler Covariaten-Einfluß für Hamburg
Auffallend ist, daß sich der Sommer etwas anders darstellt als die übrigen drei Jahreszeiten, die sich sehr ähneln. Der Hauptunterschied zwischen dem Sommer und den übrigen Jahreszeiten liegt in der Bedeutung der Covariaten Meridionalwind und dem Typ der mittelhohen Wolken, die eine höhere Wertung aufweisen, als die der der tiefen Wolken.
Das mit diesen Parametern erstellte Markov/Regressionsmodell erzielt eine bedeutende Verbesserung (Tabelle 2) gegenüber den bisher betrachteten.
4.6 Zwei-Stationen-Modell
Schließlich kann das Regressionsmodell noch durch die Einbeziehung der Daten benachbarter Synopstationen verbessert werden. Deren Lage entscheidet darüber, ob die Parameter eine Verbesserung der Vorhersage bewirken. Im Fall von Hamburg qualifiziert sich Helgoland für dieses Verfahren. Sie bringt Informationen über die Advektion in das Modell ein, weil sie in einer günstigen Richtung zu und Entfernung von Hamburg liegt. Andere Stationen, wie Schleswig oder Bremen, ergeben keine Verbesserung. Abbildung 3 zeigt, in welcher Reihenfolge die Parameter Helgolands und Hamburgs zusammenwirken, um die beste Prognose für Hamburg zu erstellen. Für die Hamburg-Vorhersage im Winter stellt der Druck in Helgoland eine der wichtigsten Covariaten dar, im Sommer ist auch die Gesamtbedeckung in Helgoland noch für die Vorhersage in Hamburg von Bedeutung.
Abb. 3: Anteil der Covariaten
5 Bewertung der Prognosen
Die Methoden der Prognosebewertung werden im folgenden für zwei Modelle und einen Vorhersagezeitraum demonstriert. Gezeigt werden das univariate Regressionsmodell Markov-Druck für Hamburg (Modell A) und das multivariate Regressionsmodell mit den zwei Stationen Hamburg und Helgoland mit Vorhersagen für Hamburg (Modell B). Für den Vorhersagezeitraum wurde die 12-Stunden Vorhersage von 6 Uhr GMT bis 18 Uhr GMT gewählt. Diese zeitliche Einschränkung ist notwendig, da für die Station Helgoland im größten Teil der Datenreihe keine 0 Uhr Meldungen existierten.
5.1 Verifikationskonzept
Das Konzept der Vorhersageverifikation basiert darauf, daß die gemeinsame Verteilung von Vorhersagen und Beobachtungen alle nicht-zeitabhängigen Informationen enthält, die für die Vorhersagequalität von Bedeutung sind (Murphy and Winkler, 1987). Diese Verteilung p(f,x) besteht aus den zweidimensionalen Wahrscheinlichkeiten aller möglichen Kombinationspaare von Vorhersage f und Beobachtung x. Diese Wahrscheinlichkeiten werden aus den relativen Häufigkeiten eines Verifikationsdatensatzes berechnet. Durch Aufteilung der gemeinsamen Verteilung p(f,x) in bedingte und Randverteilungen können die Aussagen über Vorhersagequalität weiter differenziert werden. Folgende zwei Verteilungen werden hier diskutiert:
p(f,x) = p(x|f) p(f)
p(f,x) = p(f|x) p(x)
p(x,f) ist die bedingte Verteilung der Beobachtungen in Abhängigkeit von den Vorhersagen und p(f,x) die der Vorhersagen in Abhängigkeit der Beobachtungen. p(f) und p(x) sind die Randverteilungen von Vorhersagen und Beobachtungen. Die bedingten Verteilungen p(x,f) und p(f,x) spielen in der Verifikation eine besondere Rolle, da sie das Verhältnis von Vorhersagen zu Beobachtungen charakterisieren.
Der Bestimmung der absoluten und der relativen Vorhersagequalität dienen zwei Methoden, die auf diesen Verteilungen beruhen.
(a) Verteilungen (gemeinsame, bedingte und Randverteilungen) sowie deren statistische Maße.
(b) Gütemaße für das Verhältnis zwischen f und x.
Diese Methoden wurden bisher auf Temperaturvorhersagen (Murphy et al., 1989) und Niederschlagswahrscheinlichkeitsprognosen (Murphy and Winkler, 1992) angewandt.
5.2 Verteilungen
Die Zuverlässigkeit der beiden Modelle wird in der Abbildung 4 gezeigt:
Abb. 4: Schärfe- und Zuverlässigkeitsdiagramme (siehe Text)
Zur Darstellung der Diagramme in Abb. 4 ist es notwendig, die in einem kontinuierlichen Wertebereich angesiedelten Wahrscheinlichkeitsprognosen in 20 Wahrscheinlichkeitsklassen der Breite 5% einzuordnen, um dann pro Klasse einen Funktionswert für die Verteilungen zu bestimmen. Alle Abszissen der Abbildung beziehen sich auf diese Wahrscheinlichkeitsklassen.
Im oberen Teil der Abb. 4 sind für beide Modelle die bedingten Schärfediagramme zu sehen. Sie zeigen die Verteilungen der Vorhersagen für den Fall, daß Niederschlag aufgetreten war (volle Kreise) oder nicht aufgetreten war (leere Kreise). In einem perfekten Modell treten nur Werte bei 0% und 100% auf. Eine U-förmige Verteilung und eine deutliche Trennung der bedingten Verteilungen ist Indikator für eine hohe Schärfe. Das Modell A zeigt in der Schärfe deutliche Schwächen. Die Maxima der bedingten Verteilungen liegen mit 20% im trockenen Fall p(x=0|f) und 50% im feuchten Fall p(x=1|f) sehr dicht beieinander. Im Bereich über 80% wurden fast keine Vorhersagen erzeugt. Dennoch ist ein "Skill" vorhanden, da die beiden Verteilungen deutlich voneinander getrennt verlaufen. Die Form der für das Modell B dargestellten Funktion setzt sich aus den Schärfefunktionen der drei Submodelle zusammen, wobei das Cumulusmodell den niedrigen Bereich abdeckt, das Regenmodell den hohen und das Stratusmodell den mittleren. Die bedingten Verteilungen p(x=1|f) und p(x=0|f) überlappen sich zwar, aber es dominieren eindeutig niedrige Wahrscheinlichkeiten für x=0 und hohe für x=1.
Im unteren Teil dieser Diagramme wird für jedes Modell die bedingte relative Häufigkeit des Niederschlags gegen die Vorhersagen aufgetragen, das ist die Funktion p(x=1|f) gegen f. Die Diagonale kennzeichnet die perfekte Prognose, also die Funktion p(x=1|f) = f für alle f. Ein Vergleich der Modellkurven mit der Diagonalen zeigt, daß Modell A im Bereich von 0% bis 40% noch relativ nahe an der Diagonalen operiert. Von 40% bis 70% erstreckt sich eine Zone mit deutlicher Untervorhersage. Die beobachtete Häufigkeit liegt hier bis zu 20% über der Prognose. Die Wahrscheinlichkeitsklasse über 70% ist dagegen nur noch minimal besetzt, wie aus dem Schärfediagramm ersichtlich ist. Modell B dagegen kommt mit einer Abweichung von maximal 5% dem perfekten Modell sehr nahe. Da der Fehler aber damit einen gleichen Werte, wie die Breite der Wahrscheinlichkeitsklassen aufweist, ist das Modell B damit bezüglich der Wahrscheinlichkeitsaussage gut verifiziert.
5.3 Gütemaße und statistische Parameter
Für die Beurteilung der Genauigkeit von Wahrscheinlichkeitsvorhersagen wird üblicherweise der Brier-Score (Brier, 1950) bestimmt,
wobei Vi die Vorhersagen im Wertebereich 0 bis 1 darstellen und Ei die Ereignisse mit den Werten 0 oder 1. Da ein kontinuierlicher Bereich von Vorhersagen mit zwei diskreten Ereignissen verglichen wird, erzielt man einen guten Brier-Score für eine hohe Zahl zutreffender 0 oder 1 - Prognosen. Dies ist auch ein für Wahrscheinlichkeitsvorhersagen erstrebenswertes Ziel. Deshalb stellt eine Minimierung des Brier-Scores ein wichtiges Kriterium in der Modelloptimierung dar. Der Skill-Score beschreibt die Güte eines Modells indem der Brier-Score in Relation zu einem Referenzmodell gesetzt wird:
Tabelle 7 zeigt eine Auswahl statistischer Größen zusammen mit dem Brier-Score und dem Skill-Score, die es ermöglicht, verschiedene Modelle unter diversen Aspekten zu vergleichen.
| Mittelwert | Standardabweichung | Korrelation | BS | SS | |
| Beobachtung | .498 | .500 | - | - | - |
| Persistenz | .366 | .482 | .138 | .293 | -.190 |
| Klima | .502 | .062 | .136 | .246 | .000 |
| Markov | .512 | .247 | .503 | .188 | .237 |
| Markov/Druck | .513 | .278 | .568 | .168 | .319 |
| Markov/Regression | .512 | .317 | .661 | .146 | .405 |
Tabelle 7: Verifikationsparameter für verschiedene Modelle in Hamburg
Die Klimawahrscheinlichkeit für ein Niederschlagsereignis in den nächsten 12 Stunden liegt in Hamburg im Jahresmittel mit 0,498 bei fast 50%. Da den Ereignissen die Werte 1 oder 0 zugeordnet werden, ergibt sich damit eine Varianz von 0,5. Der Mittelwert wird von allen Modellen außer der Persistenz gut getroffen. Im Fall der Persistenz liegt es daran, daß die 6-Stunden Persistenz verwendet wird, um eine 12-Stunden Vorhersage zu generieren. Die Standardabweichung der Persistenz folgt den Beobachtungen. Bei den anderen Modellen liegt die Standardabweichung niedriger, als in den Beobachtungen, mit wachsender Komplexität der Modelle nähert sie sich aber dem beobachteten Wert. Die geringe, im Klimamodell vorhandene Standardabweichung ergibt sich aus den monatlich konstanten - im Jahresverlauf aber wechselnden Vorhersagewerten. In der Korrelation zwischen den Modellen und den Beobachtungen sind Persistenz und Klima nur sehr schwach positiv korreliert. Erst die Markov- und Regressionsmodelle ergeben Korrelationskoeffizienten über 0,5. Wegen der hohen Zahl der Freiheitsgrade von 9566 im Testdatensatz sind jedoch alle Modelle im t-Test bei einem Signifikanzintervall von 99,9% positiv mit den Beobachtungen korreliert. Der Brier-Score ist die wichtigste Zahl bei der Bewertung der Modelle, da er nicht nur die Zuverlässigkeit der Vorhersagen, sondern auch ihre Schärfe einbezieht. Er ist aber stark von der Beobachtungsreihe abhängig. Deshalb können Brier-Scores verschiedener Modelle nur bei Anwendung auf denselben Datensatz verglichen werden. Eine Vergleichsmöglichkeit dabei ist der Skill-Score, der die Brier-Scores mit einem Referenzmodell, hier Klima, vergleicht.
6 Zusammenfassung
Eine Reihe von Modellen, die zur Kürzestfristprognose der Niederschlagswahrscheinlichkeit geeignet sind, wurde vorgestellt und bewertet. Als Modell mit der besten Bewertung erwies sich ein Modell, welches Markovketten mit linearer Regression kombiniert. Dies besteht im Prinzip aus Untermodellen für jede Markovklasse, die einer eigenen Regression unterzogen werden. Das Modell paßt sich für beliebige Stationen dem lokalen Klima an, wie die Anwendung auf drei Stationen mit sehr unterschiedlichen Klimaten zeigt. Die Vorhersagegüte kann noch gesteigert werden, durch die Bildung von Stationspaaren in geeigneter Richtung und Entfernung, was am Beispiel Hamburg/Helgoland demonstriert wird. Das Modell wird in einer operationellen Anwendung für das Gebiet von Deutschland erprobt. Die Vorhersagen für den Zeitraum 0-6 Stunden und 6-12 Stunden stehen im Internet unter der Adresse http://www.mi.uni-hamburg.de/cms/?id=213 zur Verfügung. Die dort gezeigte Flächenverteilung entsteht durch Interpolation der Modellergebnisse an den jeweiligen Synopstationen.
7 Literatur
Brier, G.W., 1950: Verification of forecasts expressed in terms of probability. Monthly Weather Review, 78, 1-3.
Fraedrich, K. und K. Müller, 1983: On single station forecasting: sunshine and rainfall Markovchains. Contributions to Atmospheric Physics, 56, 108-134.
Fraedrich, K., R. Bach und G. Naujokat, 1986: A single station climatology of central European fronts: number, time, and precipitation statistics. Contributions to Atmospheric Physics, 59, 54-65.
Fraedrich, K. und K. Müller, 1986: On single-station forecasting: probability of precipitation in Berlin. Contributions to Atmospheric Physics, 59, 427-434.
Fraedrich, K. und L.M. Leslie, 1987a: Combining predictive schemes in short-term forecasting. Monthly Weather Review, 115, 1640-1644.
Fraedrich, K. und L.M. Leslie, 1987b: Evaluation of techniques for the operational single station, short term forecasting of rainfall at a mid-latitude station (Melbourne). Monthly Weather Review, 115, 1645-1654.
Fraedrich, K., G.J. Holland, L.M. Leslie und G.B. Love, 1987: The challenge of very short range prediction in the tropics. - Mesoscale Analysis and Forecasting, ESA Journal, ESA-SP-282, 287-295.
Fraedrich, K. und L.M. Leslie, 1988: Real-time short-term forecasting of precipitation at an Australian tropical station. Weather and Forecasting, 3, 104-114.
Fraedrich, K. und L.M. Leslie, 1988: A minimal model for the short-term prediction of rainfall in the tropics. Weather and Forecasting, 3, 243-246.
Fraedrich, K., G. D. Hess, L. M. Leslie und A .E. Gymer, 1989: Application of a Markov technique to the operational, short-term forecasting of rainfall. Australian Meteorological Magazine, 37, 83-91.
Fraedrich, K. und C. Larnder, 1993: Scaling regimes of composite rainfall time series. Tellus, 45A, 289-298.
Gabriel, K.R. und J. Neumann, 1962: A Markov chain model for daily rainfall occurrence at Tel Aviv. Quarterly Journal of the Royal Meteorological Society, 88, 90-95.
Hess, G.D., L.M. Leslie, A.E. Guymer und K. Fraedrich, 1989: Application of a Markov technique to the operational, short-term forecasting of rainfall. Australian Meteorological Magazine, 37, 83-91.
Kemeny, J.G. und J.L. Snell, 1976: Finitive Markov chains. Springer-Verlag, 210 ff.
Murphy, A.H. und R.L. Winkler, 1984: Probability forecasting in meteorology. Journal of the American Statistical Association, 79, 489-500.
Danksagung
Diese Untersuchung wurde in Zusammenarbeit mit dem Deutschen Wetterdienst durchgeführt, der alle Daten der deutschen Synopstationen zur Verfügung stellte. Die Daten der Station Melbourne stammen vom Bureau of Meteorology in Melbourne über die University of New South Wales, die Daten der Station Bergen vom Norwegischen Wetterdienst. Für die gute Zusammenarbeit möchten wir uns bei den Herren Lance Leslie, Russel Morison, Alan Murphy und Bernd Richter bedanken.



