Theoretische Verteilungen Normalverteilung und

Werbung
Übungen zu Geostatistik 1
Theoretische Verteilungen
Normalverteilung und Standardnormalverteilung
als Beispiel einer theoretischen Verteilung
- Normalverteilung (Gaußverteilung) kann auf sehr viele
Zufallsprozesse angewendet werden.
- Stetige (kontinuierliche), symmetrische (Schiefe=0),
“glockenförmige” Verteilung.
- Mittelwert = Median = Modus
- Schiefe = 0
- Exzeß = 0
- Annahme der NV als Verteilungsmodell dort, wo die mittleren Werte
eines Datenkollektivs gleichzeitig die häufigsten
(wahrscheinlichsten) sind.
- Standardisierte Normalverteilung (zV) bei μ = 0 und σ = 1
Übungen zu Geostatistik 1
Theoretische Verteilungen
Theoretische Verteilung und empirische Häufigkeitsverteilung
Beispiel:
Normalverteilung
Beispiel:
Jahresmitteltemperatur
Mitteleuropäischer Stationen
100%
Prozente
Verteilungsfunktion
75%
Kumulative
empirische
Häufigkeitsverteilung
50%
25%
0%
7.00
8.00
9.00
10.00
Jahresmittel
15%
Wahrscheinlichkeitsdichtefunktion
Empirische
Häufigkeitsverteilung
Prozente
10%
5%
0%
7.00
8.00
9.00
Jahresmittel
10.00
Übungen zu Geostatistik 1
Theoretische Verteilungen
Anpassung einer empirischen Häufigkeitsverteilung an eine
theoretische Verteilung
Schritte:
- Suche nach einer, der empirischen HV ähnlichen
theoretischen Verteilung
(- Visuelle Prüfung (Histogramm, Stem- and Leaf Plot,
Boxplot
- Deskriptive Parameter)
SPSS-Menü
-> Deskriptive
Statistik
- Anpassung der gewählten theoret. Verteilung
(Umrechnung der theoret. Verteilung auf Datenwerte der
empirischen Verteilung)
- Überprüfung der Güte der Anpassung mittels graphischer
Verfahren oder durch spezielle Anpassungstests
Übungen zu Geostatistik 1
Theoretische Verteilungen
Prüfung der Güte der Verteilungsanpassung
Graphische „Tests“:
SPSS-Menü
-> Deskriptive
Statistik
-> Häufigkeiten
(1) Histogramm mit (angepasster) theoretischer
Wahrscheinlichkeitsdichte- bzw. Verteilungsfunktion
15%
100%
75%
Prozente
Prozente
10%
50%
5%
25%
0%
0%
7.00
8.00
9.00
Jahresmittel
10.00
7.00
8.00
9.00
Jahresmittel
10.00
Übungen zu Geostatistik 1
Theoretische Verteilungen
Prüfung der Güte der Verteilungsanpassung
Graphische „Tests“:
(2) Visuelle Prüfung der Anpassungsgüte mit QQ- (Quantile-Quantile) bzw.
PP- (Probability-Probability) Plots
P-P-Diagramm von Normal von Jahresmittel
Q-Q-Diagramm von Normal von Jahresmittel
1,0
11
SPSS-Menü
-> Deskriptive
Statistik
-> Explorative
Datenanalyse
0,8
Erwartete Kum. Wahrsch.
Erwarteter Wert von Normal
10
9
8
0,6
0,4
0,2
7
0,0
6
6
7
8
9
Beobachteter Wert
10
11
0,0
0,2
0,4
0,6
0,8
Beobachtete Kum. Wahrsch.
1,0
Übungen zu Geostatistik 1
Theoretische Verteilungen
Prüfung der Güte der Verteilungsanpassung
Statistische Anpassungstests (Beispiele):
(Vergleich einer empirischen (SP) mit einer theoretischen (GG) Verteilung)
Zur Erinnerung: Statistische Test- und Prüfverfahren
Das Signifikanzniveau:
Si = Signifikanzniveau (Sicherheitswahrscheinlichkeit) =
Wahrscheinlichkeit eines richtigen Testentscheids
● α = Irrtumswahrscheinlichkeit (1 – Si) = Wahrscheinlichkeit eines falschen
Testentscheids
●
●
grobe (und willkürliche) Einteilung:
Si = 90% = „signifikant“
Si = 95% = „sehr signifikant“
Si = 99% = „hochsignifikant“
Übungen zu Geostatistik 1
Theoretische Verteilungen
Prüfung der Güte der Verteilungsanpassung
Statistische Anpassungstests (Beispiele):
(Vergleich einer empirischen (SP) mit einer theoretischen (GG) Verteilung)
Zur Erinnerung: Statistische Test- und Prüfverfahren
Testentscheid:
In SPSS:
Ausgabe der Wahrscheinlichkeit p für das Eintreten des empirisch festgestellten
Ereignisses (ermittelter Wert der Prüfgrösse) bei Gültigkeit von H0
Ablehnen (Verwerfen) der Nullhypothese auf dem gewählten Signifikanzniveau
wenn p > α
(Synonyme für p in SPSS: Sig., Asymptotische Signifikanz)
Übungen zu Geostatistik 1
Theoretische Verteilungen
Prüfung der Güte der Verteilungsanpassung
Statistische Anpassungstests (Beispiele):
(Vergleich einer empirischen (SP) mit einer theoretischen (GG) Verteilung)
Zur Erinnerung: Statistische Test- und Prüfverfahren
Anwendungsvoraussetzungen versch. Prüfverfahren:
●
Testparameter zur Berechnung der Prüfgrösse (Übernahme von SPKenngrößen möglich oder modifizierte Berechnung?)
●
Stichprobenumfang (Mindestumfang bei einer SP, Gleichheit der SPUmfänge bei SP-Vergleichen?)
●
Voraussetzungen bzgl. des Verteilungstyps der betr. Kollektive
(verteilungsgebundene / parametrische bzw. verteilungsfreie /
nonparametrische Verfahren?)
●
Skalenniveau der Kollektive
Übungen zu Geostatistik 1
Theoretische Verteilungen
Prüfung der Güte der Verteilungsanpassung
Statistische Anpassungstests (Beispiele):
(Vergleich einer empirischen (SP) mit einer theoretischen (GG) Verteilung)
Generell gilt für Anpassungstests („Goodness of Fit“ Tests) die
Nullhypothese:
H0 = Die empirische Häufigkeitsverteilung stimmt mit einer
(gewählten) theoretischen Häufigkeitsverteilung überein.
Übungen zu Geostatistik 1
Theoretische Verteilungen
Prüfung der Güte der Verteilungsanpassung
Statistische Anpassungstests (Beispiele):
(Vergleich einer empirischen (SP) mit einer theoretischen (GG) Verteilung)
(1) Kolmogoroff-Smirnoff-Anpassungstest
(Modifizierter Test nach Lilliefors: Parameter der TV werden aus SP geschätzt)
Berechnung der Prüfgrösse:
K
∣Max SHk SP−SHk TV k=1
∣
Pr =
n
SHk(SP): Summenhäufigkeit der empirischen Verteilung
SHk(TV): Summenhäufigkeit der theoretischen Verteilung
K: Anzahl der Klassen
n: Stichprobenumfang
SPSS-Menü
-> Deskriptive Statistik
-> Explorative Datenanalyse
-> Normalverteilungsdiagramme mit Tests
bzw.
-> Nichtparametrische Tests
-> K-S bei einer Stichprobe
Voraussetzungen: Klassenorientierung der SP, n > 50, nk ≥ 4, kumulative
Häufigkeiten, verteilungsfreier Test
Übungen zu Geostatistik 1
Theoretische Verteilungen
Prüfung der Güte der Verteilungsanpassung
Statistische Anpassungstests (Beispiele):
(Vergleich einer empirischen (SP) mit einer theoretischen (GG) Verteilung)
(2) X2-Anpassungstest
Berechnung der Prüfgrösse:
K
2
H k SP−H k TV 
X =∑
H k TV 
k=1
2
SPSS-Menü
-> Nichtparametrische Tests
-> Chi Quadrat
Hk: Klassenhäufigkeit der empirischen (SP), der theoretischen (TV) Verteilung
K: Anzahl der Klassen
Φ = K-Z: Zahl der Freiheitsgrade, Z: Zahl der Parameter der theoretischen Verteilung
Voraussetzungen: Klassenorientierung der SP, n > 50, nk ≥ 4, verteilungsfreier Test
Übungen zu Geostatistik 1
Theoretische Verteilungen
Prüfung der Güte der Verteilungsanpassung
Statistische Anpassungstests (Beispiele):
(Vergleich einer empirischen (SP) mit einer theoretischen (GG) Verteilung)
(3) Shapiro-Wilk-Anpassungstest
Berechnung der Prüfgrösse:
SPSS-Menü
-> Deskriptive Statistik
-> Explorative Datenanalyse
-> Normalverteilungsdiagramme mit Tests
Anwendung:
- Nur für Prüfung auf NV anwendbar!
- Insbesondere bei Vorliegen kleiner Stichprobenumfänge (<50)
zuverlässiger als KS-Test und X2-Test
Übungen zu Geostatistik 1
Theoretische Verteilungen
Wahrscheinlichkeitsschätzungen auf Grundlage der
angepassten Verteilungsfunktion
Beispiel Normalverteilung u. Standardnormalverteilung
(2) Intervallschätzung
(a) Mutungsbereiche (Konfidenzintervalle), für Verteilungskenngrößen der
GG
(In SPSS z.B. Konfidenzintervall des Mittelwerts
-> Deskriptive Statistik -> Explorative Datenanalyse)
(b) Ereignisschätzungen
<- Schätzung des Intervalls, in dem auf Grund eines angepassten
theoretischen Verteilungsmodells künftige SP-Daten mit definitiver
Wahrscheinlichkeit vermutet werden.
Übungen zu Geostatistik 1
Theoretische Verteilungen
Wahrscheinlichkeitsschätzungen auf Grundlage der
angepassten Verteilungsfunktion
Beispiel Normalverteilung u. Standardnormalverteilung
(b) Ereignisschätzungen
2 Vorgehensweisen:
- Wahrscheinlichkeit F(a) ist vorgegeben,
zugehöriger Wert/Wertebereich
(Werteintervall ∆a) wird geschätzt
- Wert/Wertebereich (Werteintervall
∆a) ist vorgegeben, zugehörige
Eintrittswahrscheinlichkeit F(a) wird
geschätzt
Übungen zu Geostatistik 1
Theoretische Verteilungen
Wahrscheinlichkeitsschätzungen auf Grundlage der
angepassten Verteilungsfunktion
Beispiel Normalverteilung u. Standardnormalverteilung
(b) Ereignisschätzungen
In SPSS: (-> Transformieren -> Berechnen -> Funktionen)
(1) CDF.Verteilung(Zahl, Parameter der Verteilung)
– ergibt die Wahrscheinlichkeit, mit der eine Zufallsvariable (ZV), die der
angegebenen Verteilung folgt, einen Wert kleiner oder gleich Zahl annimmt
(Unterschreitungswahrscheinlichkeit).
(2) IDF.Verteilung(Wahrscheinlichkeit, Parameter der Verteilung)
– liefert den Wert, den eine der angegebenen Verteilung folgende ZV mit
einer kumulierten Wahrscheinlichkeit von Wahrscheinlichkeit annimmt.
SPSS berücksichtigt nur Unterschreitungswahrscheinlichkeiten!
Herunterladen