Statistische Analyse hydrologischer Daten - WWW

Werbung
Lehrstuhl für Hydrologie und Wasserwirtschaft
BTU Cottbus
Statistische Analyse hydrologischer Daten
(HW Berechnung)
Gliederung
1
Symbole und Abkürzungen
2
Einführung
3
Analyse hydrologischer Ganglinien
4
Prüfung der Daten für die Ermittlung von Hochwasserwahrscheinlichkeiten
5
Wahrscheinlichkeitsanalyse
5.1
5.2
5.3
5.4
5.4.1
Empirische Unterschreitungswahrscheinlichkeit
Extrapolation durch freie Anpassung
Eigenschaften der Wahrscheinlichkeitsfunktion
Anpassung theoretischer Funktionen an die Stichprobe
Schätzverfahren für die Parameter der Funktionsgleichungen
6
Anpassungstests
7
Konfidenzgrenzen für Wahrscheinlichkeitsfunktionen
8
Literaturverzeichnis
1
1
Formelzeichen und Abkürzungen
Tab. 1: Im Text verwendete Symbole und Formelzeichen
xi
Messwert (Q)
x
Mittelwert
s
Standardabweichung
s²
Varianz
Cv =
s
x
Variationskoeffizient
Cs =
S
s3
Schiefekoeffizient
S=
1 n
* ∑ ( xi − x ) 3
n i =1
Schiefe
α, Si (α+Si=1)
Irrtumswahrscheinlichkeit, Signifikanzniveau
Pi
Eintrittswahrscheinlichkeit, Unterschreitungswahrscheinlichkeit
i
Rangplatz
n
Stichprobenumfang
T
Jährlichkeit
HQa
Größter Hochwasserscheitelabfluss eines Jahres
AE
Allgemeine Extremwertverteilung
E1
Extremwertverteilung Typ 1
ME
Gemischte Extremwertverteilung Typ 1
P3
Pearson Typ 3-Verteilung
WB3
Weibull-Verteilung mit 3 Parametern
LN3
Log Normal-Verteilung mit 3 Parametern
LP3
Log Pearson Typ 3-Verteilung
Tab. 2: Übersicht zu den Einzelbegriffen der Wahrscheinlichkeitsfunktionen (Quelle: Institut für
Hydrologie u. Wasserbau Uni Karlsruhe (1990), S. 2)
+∞
f(x)
F ( x) = ∫
Grundgesamtheit
Dichtefunktion (Dichte)
Wahrscheinlichkeitsverteilung
„probability density function“ - pdf
Verteilungsfunktion
„cumulative distribution function“ - cdf
Stichprobe
Häufigkeitsverteilung
Summenhäufigkeit
−∞
2
f ( x)dx
2 Einführung
Ausgangspunkt für die Untersuchungen von hydrologisch, wasserwirtschaftlichen Daten ist eine
gemessene Zeitreihe x(t). Solche gemessenen Zeitreihen sind immer unvollständig, da endlich,
und entsprechen damit nur einer Stichprobe aus der Grundgesamtheit. Parameter, die aus der
Stichprobe und aus der Grundgesamtheit ermittelt werden, unterscheiden sich zwangsläufig, dieser Unterschied wird mit Stichprobenungenauigkeit ("sample uncertainity") bezeichnet.
Oft wird versucht, aus den in einer begrenzten Zeitreihe vorhandenen Daten durch Extrapolation
Extremwerte zu ermitteln, die eine größere Jährlichkeit besitzen, als der Länge der gemessenen
Zeitreihe entspricht. Ein Beispiel hierfür ist die Ermittlung von Jährlichkeiten von Hochwasserscheitelabflüssen durch Anpassung einer statistischen Wahrscheinlichkeitsverteilung an die gemessenen Daten. Aus der „zufälligen“ Wahl der anzupassenden Wahrscheinlichkeitsfunktion
resultiert eine Schätzungenauigkeit für die extrapolierten Werte, die Modellungenauigkeit ("model uncertainity") genannt wird. Darum sollte am Ende die Angabe von Vertrauensintervallen für
die extrapolierten Werte immer angestrebt werden.
Im Abschnitt 3 werden verschiedene Fragestellungen bei der Analyse hydrologischer Ganglinien
vorgestellt. Ab Abschnitt 4 wird die Anpassung von Wahrscheinlichkeitsverteilungen an Hochwasserscheitelabflüsse genauer erläutert.
3 Analyse hydrologischer Ganglinien
In der Hydrologie/Wasserwirtschaft unterscheidet man drei Arten von Ganglinienuntersuchungen:
-
Einzelwerte der Funktionen x(t)
-
Zeitreihenabschnitte
-
das ganze Kontinuum der Zeitreihe.
Untersuchung von Einzelwerten der Ganglinien
Diese Aufgabe wird für Hochwasser- (HW) und Niedrigwasser- (NW) Untersuchungen angewendet. Sie geht davon aus, dass die Einzelwerte statistisch unabhängige Größen sind und daher
auf der Basis von rein probabilistischen Konzepten analysiert werden können. Typisch hierfür ist
die Extremwertstatistik. Auf die statistischen Methoden hierfür wird im Weiteren genauer eingegangen.
Untersuchung von Zeitreihenabschnitten
Diese Aufgabe erfolgt meistens mit dem Ziel, über das dynamische Verhalten der beobachteten
Größe eine Aussage zu machen. Hierzu gehört z. B. die statistische Analyse von Füllen oder
3
Defiziten. Dabei werden die über oder unter einen Schwellenwert xS liegenden Teile der Zeitreihe integriert oder aufsummiert, und anschließend als neue Einzelwerte betrachtet. Bei den Letzten können anschließend die Methoden der Einzelwertstatistik angewendet werden.
Untersuchung von Zeitreihen
Diese Aufgabe umfasst das ganze Kontinuum der Zeitreihe. Es ist meistens sehr aufwendig, solche Kontinua vollständig zu analysieren. Daher werden, auf der Grundlage von Voruntersuchungen, Vereinfachungen getroffen, die die Analyse erleichtern. Die erste Vereinfachung ist die
Reduktion der Zeitreihe auf eine Folge von Mittelwerten (z. B. Tages-, Wochen-, Monats- oder
Jahreswerte). Der zweckmäßige Zeitschritt für die Diskretisierung ist von der zu untersuchenden
Aufgabe abhängig. Solche Aufgaben sind z. B. die Bemessung von: Versorgungsspeichern wie
Trinkwassertalsperren, HW-Rückhaltebecken, Bewässerungsspeichern usw. Das Werkzeug für
solche Untersuchungen der Daten ist die Zeitreihenanalyse. Dadurch werden zunächst die verschiedenen Komponenten und Charakteristika einer Ganglinie analysiert und deren statistische
Kennwerte ermittelt. Anschließend können, je nach Planungsaufgabe, künstliche Zeitreihen generiert werden, die die statistischen Kennwerte der ursprünglichen Ganglinien erhalten. Hierzu
gehören die Methoden der stochastischen Zeitreihenanalyse.
4 Prüfung der Daten für die Ermittlung von Hochwasserwahrscheinlichkeiten
Der Datensatz für statistische Analysen von Hochwasserkennwerten besteht häufig aus jährlichen Maximalabflüssen (Hochwasserscheitelabflüssen) HQa. Voraussetzung hierfür ist das Vorliegen von lang beobachteten und zuverlässigen Abflussganglinien, aus denen der höchste Scheitelabfluss jedes Jahres entnommen werden kann.
Im Gegensatz zu dieser, so genannten „jährlichen Serie“ , besteht die Möglichkeit, eine „partielle Serie“ zu bilden. Eine solche Reihe enthält alle Scheitelabflüsse des vorhandenen Zeitraums,
die über einem Grenzwert liegen, z.B. dem kleinsten Wert aller jährlichen Hochwasser. Allerdings verkompliziert sich mit den Werten einer partiellen Serie die Ermittlung der Unterschreitungswahrscheinlichkeiten ( siehe Dyck u.a. (1976)).
Bevor man mit der hydrologischen Analyse der Abflussdaten beginnen kann, muss geprüft werden, ob der zu bearbeitende Datensatz folgende Grundannahmen erfüllt:
-
ausreichender Umfang der Stichprobe (mind. 30 Werte),
-
frei von echten Fehlern (Ablesefehler, Datenerfassungsfehler),
-
auf richtigen Wasserstands-Durchfluss-Beziehungen basieren,
-
Unabhängigkeit,
4
-
Repräsentanz,
-
Homogenität und
-
frei von Ausreißern.
Unabhängigkeit der Daten ist bei jährlichen Serien meist gewährleistet, lediglich wenn zwei aufeinander folgende Hochwasser nur durch den Jahreswechsel voneinander getrennt sind, ist eine
genauere Prüfung erforderlich. Repräsentanz liegt vor, wenn die Stichprobe das langjährige Abflussverhalten wiedergibt. Zur Beurteilung sind Vergleiche mit Nachbarpegeln mit langen Beobachtungsreihen sinnvoll.
Eine erste Hilfe zur Prüfung der Zeitreihe ist ihre grafische Darstellung. Bereits hieraus sind eventuelle Ausreißer sowie sprunghafte oder kontinuierliche Veränderungen (Inhomogenitäten)
erkennbar. Die Messwerte sind auf diese Eigenschaften mit statistischen Tests zu prüfen (siehe
z.B. Schönwiese (2000)). Als Beispiel für solche Tests soll im Folgenden die Prüfung auf Ausreißer näher erläutert werden.
Ein einfach durchzuführender Test, zur Abschätzung ob einzelne Werte der Datenreihe als Ausreißer zu betrachten sind, ist die Prüfung, ob sich Werte außerhalb des Intervalls der zweifachen
positiven und negativen Standardabweichung um den Mittelwert befinden. Wenn ja handelt es
sich mit hoher Wahrscheinlichkeit um Ausreißer.
Ein weiterer, in DVWK (1999) für Hochwasserscheitelabflüsse empfohlener Test, besteht darin,
einen kritischen Grenzwert (xkrit) zu ermitteln. Dieser wird dann mit den Höchstwerten der Datenreihe verglichen. Liegen diese über dem Grenzwert, sind sie als Ausreißer zu betrachten.
Zur Ermittlung des Grenzwertes xkrit werden die HQ-Werte logarithmiert und dann aus den lnHQ
der Mittelwert und die Standardabweichung ermittelt. Der Grenzwert ergibt sich dann zu:
x krit = x + wn ,α ∗ s
wobei wn,α ein Faktor ist, der vom Stichprobenumfang und vom Signifikanzniveau abhängt (s.
Tab. 3).
Tab. 3: Kritische Werte wn,α für den Ausreißertest (Quelle: DVWK(1999), S. 20)
Umfang
n
α = 0,01
Irrtumswahrscheinlichkeit
α = 0,05
α = 0,10
10
15
20
25
30
35
40
50
60
80
100
2,540
2,800
2,959
3,071
3,156
3,224
3,281
3,370
3,440
3,543
3,618
2,294
2,494
2,623
2,718
2,792
2,853
2,904
2,987
3,052
3,152
3,226
2,146
2,327
2,447
2,537
2,609
2,668
2,718
2,800
2,865
2,965
3,039
5
Liegen Logarithmen der Extremwerte der Reihe (ln HQ) über dem berechneten Grenzwert xkrit,
so handelt es sich bei den Werten um Ausreißer im Sinne der Statistik. Die Ausreißer sollten
noch mal auf Plausibilität geprüft werden. Hierfür ist die Wasserstands-Durchfluss-Beziehung
kritisch zu prüfen. Auch sind Vergleiche mit Nachbarpegeln, über die Abflussspende, sowie mit
historischen Aufzeichnungen hilfreich. Bei den Ausreißern kann es sich durchaus um richtige
Messwerte handeln, wenn z.B. ihr Wiederkehrintervall weit über dem Stichprobenumfang liegt.
Solche Werte sollte man möglichst nicht entfernen, sondern ihnen eine höhere Jährlichkeit zuordnen. Dies kann durch Vergleiche mit Nachbarpegeln, an denen längere Beobachtungsreihen
vorliegen, oder durch Auswertung historischer Hochwasser geschehen (s. DVWK (1999), S. 21).
5 Wahrscheinlichkeitsanalyse
Mit Hilfe der Wahrscheinlichkeitsanalyse werden beobachteten Hochwasserscheitelabflüssen
eines bestimmten Zeitraums Überschreitungswahrscheinlichkeiten zugeordnet und eine Extrapolation über den Beobachtungszeitraum hinaus ermöglicht (DVWK (1999), S. 6). Mittels der geschätzten Parameterwerte der empirischen Häufigkeitsverteilung werden theoretische Wahrscheinlichkeitsverteilungen (Funktionen) an die Kennwerte der Stichproben angepasst. Bevor
eine Extrapolation/Aussage über die Über- oder Unterschreitungswahrscheinlichkeit eines Ereignisses vorgenommen wird, sollte die Güte der Anpassung zwischen der empirischen und der
jeweiligen theoretischen Wahrscheinlichkeitsverteilung quantifiziert werden. Dies geschieht mit
Hilfe von Anpassungstests. Zusätzlich sollte in jedem Fall eine optische Kontrolle der Anpassung durchgeführt werden. Dazu werden sowohl die Stichprobenwerte über den empirischen
Unterschreitungswahrscheinlichkeiten als auch die rechnerisch ermittelte Verteilungsfunktion
graphisch dargestellt.
5.1 Empirische Unterschreitungswahrscheinlichkeit
Für die Ermittlung der Verteilung der Einzelwerte wird zunächst die empirische Unterschreitungswahrscheinlichkeit Pu = Pi(x) ermittelt, aus der sich die Überschreitungswahrscheinlichkeit
Pü = (1-Pi(x)) bestimmen lässt. Dazu werden die Hochwasserscheitelabflüsse in aufsteigender
Reihenfolge der Größe nach sortiert und die Unterschreitungswahrscheinlichkeiten, auch als
plotting positions bezeichnet, mit einer der in Tab. 4 aufgeführten Formeln berechnet. “Es gibt
keinen mathematischen Grund eine Formel zu bevorzugen.” (Inst. f. Hydrologie u. Wasserbau
Uni Karlsruhe (1990), S. 18). Einige dieser Formeln werden jedoch für bestimmte Wahrscheinlichkeitsfunktionen empfohlen bzw. als Quasistandard verwendet.
6
Tab. 4: Zusammenstellung der Formeln für die plotting positions in Wahrscheinlichkeitsnetzen
(i = 1…n, n = Werteanzahl bzw. Stichprobenumfang; HQ- Hochwasserabfluss, NQNiedrigwasserabfluss; Abk. für Verteilungsfunktionen s. Tab. 1)
plotting position
Pi=i(/n+1)
Pi=(i-0,5)/n
Pi=(i-0,3)/(n-0,4)
Anwendung
HQ
HQ; WB3
HQ;
unbek.
Verteilung
Pi=(i-0,44)/(n+0,12) HQ; E1, WB3, ME
Pi=(i-0,35)/n
AE
Pi =(i-0,375)/(n+0,25) HQ; NQ, LN3
Pi=(i-0,4)/(n+0,2)
HQ, NQ ; P3, LP3
Entwickler
Weibull
Hazen
Chegodayev
Gringorton
Blom
Cunnane, Young
5.2 Extrapolation durch freie Anpassung
Die Unterschreitungswahrscheinlichkeiten, können in Wahrscheinlichkeitspapier eingetragen
werden.
Wahrscheinlichkeitspapier oder -netzdruck ist ein Diagrammpapier, bei dem die Abszisse in Abhängigkeit der Eigenschaften der Wahrscheinlichkeitsfunktion dargestellt ist. Oft wird der Wahrscheinlichkeitsnetzdruck der EI verwendet. Kann man die im Diagrammpapier eingetragenen
Werte zu einer Geraden verbinden, ist für die Daten die Annahme der Verteilung nach dieser
Funktion gerechtfertigt. Diese Gerade lässt sich leichter extrapolieren als eine Kurve.
Mittels der Unterschreitungswahrscheinlichkeit ist man in der Lage, die Wiederkehrintervalle
oder Jährlichkeiten der gemessenen Hochwasser über die Gleichung T =
1
zu berechnen.
(1 − Pi )
Nach einer erfolgreichen Anpassung lassen sich aus der graphischen Darstellung die Wahrscheinlichkeiten für bestimmte Abflussmengen direkt ablesen. Umgekehrt kann man auch die
Wahrscheinlichkeit für ein Wiederkehrintervall über Pi=1-(1/T) berechnen und den dazugehörigen Abfluss in dem Diagramm abgreifen. Die Extrapolationszeitspanne sollte jedoch nicht mehr
als das Zwei- bis Dreifache der Messreihenlänge betragen. Außerdem ist zu beachten, dass die
Stichprobe auch für den extrapolierten Bereich repräsentativ sein muss. Bei diesem einfachen,
grafischen Verfahren wird die Frage nach der theoretischen Verteilungsfunktion der HQ-Werte
nicht gestellt. Wie man eine theoretische Verteilungsfunktion rechnerisch an die HQ-Werte anpasst, wird in den nächsten Kapiteln beschrieben.
Beispiel: In der Abb. 1 erfolgte im Wahrscheinlichkeitsnetzdruck der Extremwertverteilung
Typ 1 eine gute Anpassung für das Dorf C. Ein Ereignis mit einer Jährlichkeit von 100 (Unterschreitungswahrscheinlichkeit Pi=0,99) hat im Dorf C einen Spitzenabfluss von ca. 14 m³/s. Ein
7
Spitzenabfluss von ca. 10 m³/s entspricht einem Hochwasser mit einem 20 jährigen Wiederkehrintervall (Pi=0,95).
Abb. 1: Beispiele von Verteilungen im Netzdruck der E1, die plotting positions von C-Dorf
lassen sich durch eine Gerade ausgleichen, hier kann die E1 als Verteilungsfunktion gewählt werden (Quelle: DVWK (1999), S. 24)
Die plotting positions von A-Dorf lassen sich durch 2 Geraden gut anpassen, hier würde man
also eine gemischte Extremwertverteilung, bestehen aus zwei E1-Verteilungen wählen. Die Ursachen können in unterschiedlichen Hochwassergenesen begründet sein. Für die grafische Anpassung von B-Dorf und D-Dorf müssen Wahrscheinlichkeitsnetzdrucke anderer Verteilungsfunktionen gewählt werden.
5.3 Eigenschaften der Wahrscheinlichkeitsfunktion
Dichtefunktion:
f ( x) = lim f ( x, n)
Verteilungsfunktion:
Fx ( x) =
n →∞
x
∫ f ( x)dx
−∞
Eigenschaften:
f ( x) ≥ 0 für alle x und 0 ≤ F ( x) ≤ 1
Alle theoretischen Funktionen, die diese Bedingungen erfüllen, können als Wahrscheinlichkeitsfunktionen verwendet werden. Für diese gelten die Axiome zur Wahrscheinlichkeit (siehe Inst. f.
Hydrologie u. Wasserbau Uni Karlsruhe (1990), S. 2). Für die Zwecke der hydrologischen Anwendungen sind die folgenden Eigenschaften besonders wichtig:
-
Die Dichte f(x) ist bekannt, wenn alle ihre Momente bekannt sind.
-
Wenn y eine eindeutige Funktion g(x) ist, dann kann die (bekannte) Dichte f(x) in die entsprechende Dichte f(y) umgewandelt werden über die Beziehung:
8
f ( y ) = f ( x) ⋅
-
dx
dy
Insbesondere folgt aus diesem Satz auch:
F[g(x)]=F(x)
Unter Anwendung der zweiten Eigenschaft kann mit Hilfe einer linearen Transformation jede
Dichtefunktion umgewandelt werden, um damit eine proportionale Funktion f(y) mit dem Mittelwert 0 und der Streuung 1 zu erreichen.
Die in der Hydrologie am häufigsten angewendeten Wahrscheinlichkeitsfunktionen sind:
a) - die Gleichverteilung (GV), 1 Parameter,
b) - die Normalverteilung (NV), 2 Parameter,
- die logarithmische Normalverteilung (log-NV), 2 Parameter,
- die verallgemeinerte log-Normalverteilung (LN3), 3 Parameter,
c) - die allgemeine Extremwertverteilung (AE), 3 Parameter,
- die Weibullverteilung (Extremwertverteilung Typ III), 2 Parameter, in erweiterter Form 3
Parameter (WB3),
- die Gumbelverteilung (Extremwertverteilung Typ I, E1), 2 Parameter,
- die gemischte Extremwertverteilung (Rossi-Verteilung, ME), 4 Parameter,
d) - die Exponentialverteilung (EP), 2 Parameter,
e) - die Pearson-Typ3-Verteilung (P3, Gammaverteilung), 3 Parameter,
- die logarithmische Pearson-Typ3-Verteilung LP3, 3 Parameter.
Die möglichen Parameter der Funktionen sind:
-
der Formparameter,
-
der Lageparameter und
-
der Maßstabsparameter.
Die Parameter der Wahrscheinlichkeitsfunktionen müssen aus den Kennwerten der empirischen
Verteilung geschätzt werden, dabei ist auf
-
Erwartungstreue,
-
Effizienz und
-
Robustheit zu achten.
Bei der Wahl einer theoretischen Wahrscheinlichkeitsfunktion sollte:
-
ihre Form mit der empirischen Wahrscheinlichkeitsfunktion übereinstimmen,
9
-
sie sollte physikalisch plausibel sein (einseitige Begrenzungen) und
-
die Parameter sollten leicht zu berechnen sein.
Unter Beachtung der physikalischen Plausibilität ist es nicht richtig, die Normalverteilung als
Verteilung für Hochwasser zu nutzen, da sie linksseitig nicht begrenzt ist, es aber keine negativen Hochwasser gibt. Die Normalverteilung kann für die Untersuchung der Verteilung des jährlichen Abflussvolumen verwendet werden. Das „Central limit theorem“ besagt, dass die Summen von vielen unabhängigen Ereignissen eine Normalverteilung annehmen, unabhängig von
der Verteilung der Einzelereignisse (S. A. Thompson (1999), S.35)
5.4 Anpassung theoretischer Funktionen an die Stichproben
Die grundsätzliche Vorgehensweise einer Anpassung von theoretischen Funktionen an die Verteilung der Messwerte (empirische Verteilungsfunktion) ist in Abbildung 2 graphisch dokumentiert. Als erstes werden die empirischen Daten hinsichtlich der Fragestellung sortiert und ausgewertet (Abb. a, b und c). Als nächstes werden die absoluten Daten in relative Werte umgewandelt (Abb. d, e) und im Anschluss in eine allgemeine Verteilung übertragen (Abb. f, g). Der letzte Schritt ist die Angleichung einer Verteilung basierend auf einer analytischen Funktion an die
Messergebnisse.
Ein gutes Resultat erzielt man, indem die Ergebnisse der Anpassung von mehreren Verteilungsfunktionen auf ihre Güte vergleichen werden. „Die beste Anpassung liegt vor, wenn die Summenhäufigkeit und die analytische Verteilungsfunktion möglichst gut über der ganzen x-Achse,
besonders aber in den Extrembereichen, [...], gut übereinstimmen“ (Quelle: Inst. f. Hydrologie u.
Wasserbau Uni Karlsruhe (1990), S. 22). Es ist zu beachten, dass Transformationen, durch ungleichmäßige Wichtung, die hohen Extremwerte gegenüber den kleinen Werten benachteiligen
können.
Tab. 5 enthält beispielhaft die Gleichungen der Dichte- und Verteilungsfunktion der Allgemeinen Extremwertverteilung AE, der Extremwertverteilung Typ 1 E1 und der PearsonTyp 3Verteilung P3.
10
Abb. 2: Schrittfolge zur Anpassung einer theoretischen Verteilung an die Messreihe (Quelle:
nach Plate in DVWK (1985))
11
Tab. 5: Dichte- und Verteilungsfunktion der AE, E1 und P3 mit a-Formparameter, c-Lageparameter und d-Maßstabsparameter (Quelle: DVWK (1999))
Funktion
Dichtefunktion
AE
f (x) =
E1
f (x) =
1
P3
x − c ⎞a
1⎛
⎜1 − a
⎟
d⎝
d ⎠
f (x) =
−1
Verteilungsfunktion
1⎤
⎡
⎢ ⎛
x − c ⎞a ⎥
F ( x ) = exp ⎢ − ⎜1 − a
⎟ ⎥
d ⎠ ⎥
⎢ ⎝
⎣
⎦
1⎤
⎡
⎢ ⎛
x − c ⎞a ⎥
⋅ exp⎢− ⎜1 − a
⎟ ⎥
d ⎠ ⎥
⎢ ⎝
⎣
⎦
⎡
1
⎛ x −c ⎞
⎛ x − c ⎞⎤
exp⎜ −
⎟ ⋅ exp⎢− exp⎜ −
⎟⎥
d
d
d ⎠⎦
⎝
⎠
⎝
⎣
⎛x −c⎞
⎜
⎟
⎝ d ⎠
a −1
⎛ x −c⎞
⋅ exp⎜ −
⎟
d ⎠
⎝
d ⋅ Γ(a )
Gültigkeitsbereich
x<c+
d
a
für a <0,
x>c +
d
a
für a >0; a >-1, d >0
⎡
⎛ x − c ⎞⎤
F ( x ) = exp ⎢− exp⎜ −
⎟⎥
d ⎠⎦
⎝
⎣
− ∞ < x < ∞ , d >0
⎛ x −c⎞
Γ⎜ a
⎟
d ⎠
⎝
F(x) =
Γ(a )
a >0, x < c bei d < 0, x > c
bei d > 0
5.4.1 Schätzverfahren für die Parameter der Funktionsgleichungen
Maximum Likelihood Methode
Mit dieser Methode werden häufig die besten Ergebnisse erzielt, aber auf Grund des hohen Rechenaufwandes kommt sie selten zur Anwendung, wenn man die Berechnungen „zu Fuß“ durchführen muss (genauere Erklärung siehe Inst. f. Hydrologie u. Wasserbau Uni Karlsruhe (1990) S.
13). In der Praxis wird jedoch auf die Ergebnisse nicht verzichtet, da es Programme gibt, z.B.
HQ-EX von WASY, in denen der Algorithmus integriert ist. Es muss jedoch erst die Verteilungsfunktion gewählt werden und dann können die Momente berechnet werden.
Momentenmethode
Bei der Momentenmethode können die Momente der Stichprobe unabhängig von der dann gewählten Verteilungsfunktion berechnet werden. Dieser Methode liegt zugrunde, dass die Parameter der Wahrscheinlichkeitsverteilungen durch deren Momente ausgedrückt werden können.
Bei der Schätzung werden diese Momente der Grundgesamtheit den entsprechenden Momenten
der Stichprobe gleichgesetzt. Man drückt also die theoretischen Momente mx der Dichte f(x)
durch die für diese Momente zu gewinnenden Schätzwerte Mx aus den Daten aus.
+∞
mxk =
∫x
k
f ( x) d x
−∞
Hierbei ist mxk das k-te Moment der Dichte f(x) bezogen auf x = 0. Für den Fall k=0 ist
∞
mx 0 =
∫ f ( x)dx = 1 ,
−∞
12
da die Fläche unter der Dichte fx(x) definitionsgemäß eins sein muss.
Der Schätzwert für Mx1 aus den Daten ist das arithmetische Mittel.
1 n
∑ xi = x ,
n i =1
M x1 =
Wichtige Momente höherer Ordnung werden nicht auf x=0, sondern auf den Mittelwert µx bzw.
x bezogen. Diese Momente um den Schwerpunkt heißen Zentralmomente (z.B. die Varianz mx2
und die Schiefe mx3).
Beispiel: Ermittlung der Momente und der Verteilungsfunktion für die Extremwertverteilung
Typ 1 E1:
Die E1 hat als Sonderfall der AE zwei Parameter (vgl. Tab. 5), Lageparameter c (bei anderen
Autoren, z.B. Dyck auch mit mod(x) bezeichnet) und Maßstabsparameter d (bei anderen Autoren, z. B. Dyck auch mit 1/a bezeichnet), der Formparameter a (vgl. Tab. 5) ist definitionsgemäß
Null. Die Bestimmungsgleichungen lauten:
1
2
d =
⋅ m2
π
6
c = m1 − γ ⋅ d
γ = 0,5772 (Eulersche Konstante)
Für das erste Moment m1 wird der Mittelwert x der Stichprobe gesetzt, für das zweite Moment
m2 wird die Varianz s² der Stichprobe eingesetzt. Damit lassen sich die Parameter d und c wie
folgt errechnen:
d =
6
π
⋅s
c = x − 0,5772 ⋅ d
⎡
⎛ x − c ⎞⎤
⎟⎥
d ⎠⎦
⎝
Die Verteilungsfunktion der E1 lautet: F ( x ) = exp⎢− exp⎜ −
⎣
Setzt
man
⎛x −c⎞
⎜
⎟ = y und
⎝ d ⎠
löst
F ( x ) = exp( − exp( − y )) = e − e
−y
nach
x
auf,
so
erhält
man
x = y ⋅d + c
und
.
Umgestellt nach y ergibt sich: y = − ln(− ln F ( x )) .
Zwischen der Verteilungsfunktion F(x) und dem Wiederkehrintervall T besteht die Beziehung:
T =
1
,
1 − F(x)
damit erhält man:
y = − ln ln
T
T −1
Mit x = HQ ergibt sich damit die Verteilungsfunktion zu:
HQ(T ) = y ⋅ d + c = − ln ln
HQ(T ) = −
T
⋅d + c
T −1
⎡⎛
⎤
T ⎞
⋅ s(HQ ) ⋅ ⎢⎜ ln ln
⎟ + 0,5772⎥ + HQ
T − 1⎠
π
⎣⎝
⎦
6
13
frequency factor Methode
Auf der zuletzt angegebenen Gleichung beruht auch die frequency factor Methode (k-FaktorMethode), sie entspricht einer versteckten Momentenmethode. In den k Faktor fließen je nach
Verteilungsfunktion Mittelwert, Standardabweichung, Schiefe, der Stichprobenumfang und die
Jährlichkeit bzw. Eintrittswahrscheinlichkeit ein. Die frequency factor Methode beruht auf der
Gleichung:
x (T ) = x + k (T ) ⋅ s( x )
und mit x = HQ
Für die E1 ergibt sich k(T) zu:
HQ(T ) = HQ + k (T ) ⋅ s(HQ )
k (T ) = −
⎤
T ⎞
6 ⎡⎛
⋅ ⎢⎜ ln ln
⎟ + 0,5772⎥
T − 1⎠
π ⎣⎝
⎦
Der Faktor k(T) ist für verschiedene Verteilungsfunktionen tabelliert. Solche Tabellen findet
man zum Beispiel in Thompson (1999) für die Standardnormalverteilung auf S. 36, Lognormalverteilung S. 246, Gumbelverteilung S. 249 und die Pearson Typ 3 Verteilung S. 250. Es werden
die Hochwasserscheitelabflüsse x = HQ für die ausgewählten Wahrscheinlichkeiten berechnet.
Die auf diesem Wege ermittelten Wertepaare von Abfluss und Eintrittswahrscheinlichkeit werden anhand der gemessenen Abflüsse und ihrer plotting position auf ihre Qualität überprüft.
Auch bei dieser Methode sollte die Verteilung verwendet werden, die die kleinsten Abweichungen hervorruft. Die Gleichung kann auch nach k umgestellt werden, um das Wiederkehrintervall
eines gemessenen Abflusses aus der Tabelle ablesen zu können.
Tab. 6: Frequency factor für Pearson Typ-3 Verteilung [Cs=s] (Quelle: Thompson (1999), S.
250)
14
Wahrscheinlichkeitsgewichtete Momentenmethode
Es besteht auch die Möglichkeit, anstelle der Momente die wahrscheinlichkeitsgewichteten k-ten
Momente der empirischen Verteilung für die Berechnung der Parameter der theoretischen Funkwk =
tion zu ermitteln.
(
1 n k
⋅ ∑ Pi ⋅ xi
n i =1
)
Die Parametergleichungen für die einzelnen Funktionen sind z.B. DVWK (1999) zu entnehmen.
Wahrscheinlichkeitsgewichtete Momente wichten größere Hochwasser stärker als kleine, ihr
Vorteil besteht darin, dass die Berechnung der zweiten und dritten Momente ohne Exponenten
auskommt. Sie sind daher unabhängiger von einzelnen Extremereignissen als herkömmliche
Momente.
Nach der Berechnung der spezifischen Parameter der Stichprobe werden die Wahrscheinlichkeitsverteilungen F(x) für die Abflüsse HQa = x über die entsprechenden Gleichungen ermittelt.
Die Anpassung der theoretischen Verteilungen an die Stichprobe wird auf ihre Güte getestet. Bei
positivem Prüfergebnis kann die Wahrscheinlichkeitsfunktion für die Ermittlung von Abflüssen
bestimmter Jährlichkeit bis zur 2-3 fachen Länge der Beobachtungsreihe und für die Zuordnung
von Jährlichkeiten für bestimmte Abflüsse genutzt werden.
Für die Bestimmung von Hochwasserabflüssen T<5 Jahre muss eine Korrektur des Wiederkehrintervalls vorgenommen werden, weil die aus Jahreshöchstabflüssen abgeleiteten Wiederholungszeitspannen T auch nur für Jahreshöchstabflüsse gültig sind. Gesucht ist in der Regel jedoch die mittlere Wiederholungszeitspanne T* zwischen Hochwassern bestimmter Größe, unabhängig davon, ob es sich um Jahreshöchstabflüsse handelt. Sie sind häufiger zu erwarten als es
durch T wiedergegeben wird (DVWK (1999), S. 13):
e1 / T *
T = 1/ T*
e
−1
6
Anpassungstests
Mittels Anpassungstests kann geprüft werden, ob sich eine gewählte Verteilungsfunktion an eine
vorliegende Stichprobe anpassen lässt. Solche Tests gestatten eine Aussage zu einer möglichen
Unvereinbarkeit der Stichprobe mit der angenommenen Verteilungsfunktion.
Bevor ein Anpassungstest durchgeführt wird, sollten stets die empirische und theoretische Verteilung graphisch dargestellt werden, da ein optischer Vergleich unerlässlich ist.
Die wichtigsten Testverfahren zur Anpassung sind:
15
-
χ2-Test (Chi-Quadrat-Test)
-
Kolmogorow-Smirnow-Test (K-S-Test)
-
nω² Anpassungstest (siehe DVWK (1999))
-
Quantil-Korrelationstest (siehe DVWK (1999))
Der χ2-Test eignet sich für alle Verteilungen, setzt aber eine Klasseneinteilung voraus, ist also
nur bei verhältnismäßig großen Datenkollektiven (n > 30) anwendbar. Die Zuverlässigkeit eines
Tests wächst mit zunehmendem Stichprobenumfang. Beim χ2-Test wird die Summe der Abweichungsquadrate zwischen Unterschreitungswahrscheinlichkeit Pi und Verteilungsfunktion, bezogen auf die Verteilungsfunktion berechnet.
Der ermittelte Wert für χ² muss anschließend mit dem aus einer Tabelle entnommenen Grenzwert bei gewähltem Signifikanzniveau (siehe Schönwiese (2000), S. 130-132) verglichen werden
und kleiner sein.
Der Anpassungstest nach Kolmogorow-Smirnow erfolgt nach dem gleichen Prinzip wie der χ2Test, nur wird anstelle aller Differenzen zwischen empirischer und theoretischer Wahrscheinlichkeit die maximale Abweichung der empirischen von der theoretischen Verteilungsfunktion
an einem Punkt, bezogen auf den Stichprobenumfang betrachtet. Dieses maximale Abweichungsmaß wird als Prüfgröße verwendet.
7
Konfidenzgrenzen für Wahrscheinlichkeitsfunktionen
Bei der Anwendung von Wahrscheinlichkeitsfunktionen sollte beachtet werden, dass die berechnete Wahrscheinlichkeitsfunktion aus der Stichprobe nur eine Schätzung der wahren Wahrscheinlichkeitsfunktion der Grundgesamtheit ist. Die Güte, mit welcher das Verhalten der
Grundgesamtheit repräsentiert wird, hängt in erster Linie von dem Umfang der Stichprobe ab.
Der Vertrauensbereich (Konfidenzbereich), in dem der wahre Wert liegen kann, wird mit zunehmendem Abstand zum Mittelwert immer größer. Unter der Annahme, dass die Abweichungen um den berechneten Wert normalverteilt sind (vgl. Abb. 4), können die Grenzen dieses Bereiches mit einer festgelegten Wahrscheinlichkeit bestimmt werden = Konfidenzgrenzen. Mit
den Konfidenzgrenzen kann ein Maß der Unbestimmtheit der geschätzten Unterschreitungswahrscheinlichkeit, eines vorgegebenen Abflusses, angegeben werden. Ebenso kann das Maß
der Unbestimmtheit eines Abflusses bei einer vorgegebenen Unterschreitungswahrscheinlichkeit
16
damit beschrieben werden. Die Anwendung von Konfidenzgrenzen als Entscheidungshilfen kann
bei Planungsarbeiten von Bedeutung sein.
Abb. 3: Konfidenzintervall um eine Verteilungsfunktion (Quelle: DVWK (1999); S.10)
Beispiel: Die Konfidenzgrenzen xk(y) der E1 können wie folgt berechnet werden (Dyck u.a.
(1976)):
für y < 5:
x k (y ) =
1
1
y + mod( x ) ±
1 + 0,609 ⋅ (0,423 + y )2
a
a n
für y ≥ 5:
x k (y ) =
1⎛
0,781 ⎞
0,333
⎜1 ±
⎟ y + mod( x ) ±
⎜
⎟
a⎝
n ⎠
a n
Dabei gilt
1
= d und mod(x) = c gemäß Parameterdefinition im Beispiel im Abschnitt 5.4.1.
a
Der Zusammenhang zwischen y und T ist gegeben durch die Gleichung: y = − ln ln⎛⎜
T ⎞
⎟.
T
⎝ − 1⎠
Damit können für verschiedene y oder für verschiedene T die oberen und unteren Kontrollkurveneintragstellen HQk(y) bzw. die HQk(T) berechnet werden.
8 Literaturverzeichnis (für die inhaltliche Zusammenstellung verwendete Literatur)
-
Dyck u.a. (1976): Angewandte Hydrologie, Teil 1, Berechnung und Regelung des Durchflusses der Flüsse. Berlin.
-
Dyck, S.; G. Peschke (1995). Grundlagen der Hydrologie. Berlin.
-
DVWK (1999). Statistische Analyse von Hochwasserabflüssen. DVWK-Merkblätter zur
Wasserwirtschaft Nr. 251. Bonn.
-
Inst. f. Hydrologie u. Wasserbau Uni Karlsruhe (1990). Hydrologische Planungsgrundlagen.
Karlsruhe.
17
-
Lehstuhl für Hydrologie und Wasserwirtschaft, BTU Cottbus (2001). Statistische Analyse
hy-drologischer Daten – Script zur Vorlesung.
-
Linsley, R. K. et al. (1985). Hydrology for Engineers. Third Edition. McGraw Hill Book
Company, Auckland.
-
Schönwiese, C.-D. (2000). Praktische Statistik für Meteorologen und Geowissenschaftler.
Berlin-Stuttgart.
-
Thompson, S. A. (1999). Hydrology for water management. Balkema, Rotterdam.
weitere empfohlene Literatur
-
Bretschneider, H. et al. (Herausgeber) (1993). Taschenbuch der Wasserwirtschaft. 7. Auflage. Paul
Parey Verlag, Hamburg.
-
Dahmen, E. R.; M. J. Hall (1990). Screening of Hydrological Data: Test for Stationarity and Relative
Consistency. ILRI Publication No. 49., P. O. Box 45, Wageningen, The Netherlands.
-
Dingman, S. L. (1994): Physical Hydrology. Macmillan Publishing Company, New York.
-
DVWK (1988). Statistische Methoden zu Niedrigwasserdauern und Starkregen. DVWK-Schriften Nr.
82. Verlag Paul Parey, Hamburg.
-
Dyck, S. et al. (1977). Angewandte Hydrologie. Teil 1. Verlag von Wilhelm Ernst & Sohn. Berlin München.
-
Haan, C. T. (1977). Statistical Methods in Hydrology. Iowa State University Press, Ames, Iowa.
-
Kotegada, N. T. (1980). Stochastic Water Resources Technology. Macmillan Press Ltd., London.
-
Langguth, H.-R.; R. Voigt (1980). Hydrogeologische Methoden. Springer Verlag. Berlin.
-
Linsley, R. K. et al. (1992). Water Resources Engineering. Fourth Edition. Chapter 5. McGraw Hill
Inc., New York.
-
Maidment, D. R. (Ed.) (1993). Handbook of Hydrology. McGraw Hill Inc., New York.
-
Sachs, L. (1984). Angewandte Statistik. Sechste Auflage. Springer-Verlag, Berlin.
-
Schneide, K. (1983). Modell zur gleichzeitigen Erzeugung von Tagesabflußdaten an mehreren Stellen
in einem Einzugsgebiet. Schriftenreihe Hydrologie/Wasserwirtschaft Nr. 2., Ruhr-Universität Bochum.
-
Ven Te Chow et al. (1988). Applied Hydrology. McGraw Hill International Editions, New York.
18
Herunterladen