Übungen zu Geostatistik 1 Theoretische Verteilungen Normalverteilung und Standardnormalverteilung als Beispiel einer theoretischen Verteilung - Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. - Stetige (kontinuierliche), symmetrische (Schiefe=0), “glockenförmige” Verteilung. - Mittelwert = Median = Modus - Schiefe = 0 - Exzeß = 0 - Annahme der NV als Verteilungsmodell dort, wo die mittleren Werte eines Datenkollektivs gleichzeitig die häufigsten (wahrscheinlichsten) sind. - Standardisierte Normalverteilung (zV) bei μ = 0 und σ = 1 Übungen zu Geostatistik 1 Theoretische Verteilungen Theoretische Verteilung und empirische Häufigkeitsverteilung Beispiel: Normalverteilung Beispiel: Jahresmitteltemperatur Mitteleuropäischer Stationen 100% Prozente Verteilungsfunktion 75% Kumulative empirische Häufigkeitsverteilung 50% 25% 0% 7.00 8.00 9.00 10.00 Jahresmittel 15% Wahrscheinlichkeitsdichtefunktion Empirische Häufigkeitsverteilung Prozente 10% 5% 0% 7.00 8.00 9.00 Jahresmittel 10.00 Übungen zu Geostatistik 1 Theoretische Verteilungen Anpassung einer empirischen Häufigkeitsverteilung an eine theoretische Verteilung Schritte: - Suche nach einer, der empirischen HV ähnlichen theoretischen Verteilung (- Visuelle Prüfung (Histogramm, Stem- and Leaf Plot, Boxplot - Deskriptive Parameter) SPSS-Menü -> Deskriptive Statistik - Anpassung der gewählten theoret. Verteilung (Umrechnung der theoret. Verteilung auf Datenwerte der empirischen Verteilung) - Überprüfung der Güte der Anpassung mittels graphischer Verfahren oder durch spezielle Anpassungstests Übungen zu Geostatistik 1 Theoretische Verteilungen Prüfung der Güte der Verteilungsanpassung Graphische „Tests“: SPSS-Menü -> Deskriptive Statistik -> Häufigkeiten (1) Histogramm mit (angepasster) theoretischer Wahrscheinlichkeitsdichte- bzw. Verteilungsfunktion 15% 100% 75% Prozente Prozente 10% 50% 5% 25% 0% 0% 7.00 8.00 9.00 Jahresmittel 10.00 7.00 8.00 9.00 Jahresmittel 10.00 Übungen zu Geostatistik 1 Theoretische Verteilungen Prüfung der Güte der Verteilungsanpassung Graphische „Tests“: (2) Visuelle Prüfung der Anpassungsgüte mit QQ- (Quantile-Quantile) bzw. PP- (Probability-Probability) Plots P-P-Diagramm von Normal von Jahresmittel Q-Q-Diagramm von Normal von Jahresmittel 1,0 11 SPSS-Menü -> Deskriptive Statistik -> Explorative Datenanalyse 0,8 Erwartete Kum. Wahrsch. Erwarteter Wert von Normal 10 9 8 0,6 0,4 0,2 7 0,0 6 6 7 8 9 Beobachteter Wert 10 11 0,0 0,2 0,4 0,6 0,8 Beobachtete Kum. Wahrsch. 1,0 Übungen zu Geostatistik 1 Theoretische Verteilungen Prüfung der Güte der Verteilungsanpassung Statistische Anpassungstests (Beispiele): (Vergleich einer empirischen (SP) mit einer theoretischen (GG) Verteilung) Zur Erinnerung: Statistische Test- und Prüfverfahren Das Signifikanzniveau: Si = Signifikanzniveau (Sicherheitswahrscheinlichkeit) = Wahrscheinlichkeit eines richtigen Testentscheids ● α = Irrtumswahrscheinlichkeit (1 – Si) = Wahrscheinlichkeit eines falschen Testentscheids ● ● grobe (und willkürliche) Einteilung: Si = 90% = „signifikant“ Si = 95% = „sehr signifikant“ Si = 99% = „hochsignifikant“ Übungen zu Geostatistik 1 Theoretische Verteilungen Prüfung der Güte der Verteilungsanpassung Statistische Anpassungstests (Beispiele): (Vergleich einer empirischen (SP) mit einer theoretischen (GG) Verteilung) Zur Erinnerung: Statistische Test- und Prüfverfahren Testentscheid: In SPSS: Ausgabe der Wahrscheinlichkeit p für das Eintreten des empirisch festgestellten Ereignisses (ermittelter Wert der Prüfgrösse) bei Gültigkeit von H0 Ablehnen (Verwerfen) der Nullhypothese auf dem gewählten Signifikanzniveau wenn p > α (Synonyme für p in SPSS: Sig., Asymptotische Signifikanz) Übungen zu Geostatistik 1 Theoretische Verteilungen Prüfung der Güte der Verteilungsanpassung Statistische Anpassungstests (Beispiele): (Vergleich einer empirischen (SP) mit einer theoretischen (GG) Verteilung) Zur Erinnerung: Statistische Test- und Prüfverfahren Anwendungsvoraussetzungen versch. Prüfverfahren: ● Testparameter zur Berechnung der Prüfgrösse (Übernahme von SPKenngrößen möglich oder modifizierte Berechnung?) ● Stichprobenumfang (Mindestumfang bei einer SP, Gleichheit der SPUmfänge bei SP-Vergleichen?) ● Voraussetzungen bzgl. des Verteilungstyps der betr. Kollektive (verteilungsgebundene / parametrische bzw. verteilungsfreie / nonparametrische Verfahren?) ● Skalenniveau der Kollektive Übungen zu Geostatistik 1 Theoretische Verteilungen Prüfung der Güte der Verteilungsanpassung Statistische Anpassungstests (Beispiele): (Vergleich einer empirischen (SP) mit einer theoretischen (GG) Verteilung) Generell gilt für Anpassungstests („Goodness of Fit“ Tests) die Nullhypothese: H0 = Die empirische Häufigkeitsverteilung stimmt mit einer (gewählten) theoretischen Häufigkeitsverteilung überein. Übungen zu Geostatistik 1 Theoretische Verteilungen Prüfung der Güte der Verteilungsanpassung Statistische Anpassungstests (Beispiele): (Vergleich einer empirischen (SP) mit einer theoretischen (GG) Verteilung) (1) Kolmogoroff-Smirnoff-Anpassungstest (Modifizierter Test nach Lilliefors: Parameter der TV werden aus SP geschätzt) Berechnung der Prüfgrösse: K ∣Max SHk SP−SHk TV k=1 ∣ Pr = n SHk(SP): Summenhäufigkeit der empirischen Verteilung SHk(TV): Summenhäufigkeit der theoretischen Verteilung K: Anzahl der Klassen n: Stichprobenumfang SPSS-Menü -> Deskriptive Statistik -> Explorative Datenanalyse -> Normalverteilungsdiagramme mit Tests bzw. -> Nichtparametrische Tests -> K-S bei einer Stichprobe Voraussetzungen: Klassenorientierung der SP, n > 50, nk ≥ 4, kumulative Häufigkeiten, verteilungsfreier Test Übungen zu Geostatistik 1 Theoretische Verteilungen Prüfung der Güte der Verteilungsanpassung Statistische Anpassungstests (Beispiele): (Vergleich einer empirischen (SP) mit einer theoretischen (GG) Verteilung) (2) X2-Anpassungstest Berechnung der Prüfgrösse: K 2 H k SP−H k TV X =∑ H k TV k=1 2 SPSS-Menü -> Nichtparametrische Tests -> Chi Quadrat Hk: Klassenhäufigkeit der empirischen (SP), der theoretischen (TV) Verteilung K: Anzahl der Klassen Φ = K-Z: Zahl der Freiheitsgrade, Z: Zahl der Parameter der theoretischen Verteilung Voraussetzungen: Klassenorientierung der SP, n > 50, nk ≥ 4, verteilungsfreier Test Übungen zu Geostatistik 1 Theoretische Verteilungen Prüfung der Güte der Verteilungsanpassung Statistische Anpassungstests (Beispiele): (Vergleich einer empirischen (SP) mit einer theoretischen (GG) Verteilung) (3) Shapiro-Wilk-Anpassungstest Berechnung der Prüfgrösse: SPSS-Menü -> Deskriptive Statistik -> Explorative Datenanalyse -> Normalverteilungsdiagramme mit Tests Anwendung: - Nur für Prüfung auf NV anwendbar! - Insbesondere bei Vorliegen kleiner Stichprobenumfänge (<50) zuverlässiger als KS-Test und X2-Test Übungen zu Geostatistik 1 Theoretische Verteilungen Wahrscheinlichkeitsschätzungen auf Grundlage der angepassten Verteilungsfunktion Beispiel Normalverteilung u. Standardnormalverteilung (2) Intervallschätzung (a) Mutungsbereiche (Konfidenzintervalle), für Verteilungskenngrößen der GG (In SPSS z.B. Konfidenzintervall des Mittelwerts -> Deskriptive Statistik -> Explorative Datenanalyse) (b) Ereignisschätzungen <- Schätzung des Intervalls, in dem auf Grund eines angepassten theoretischen Verteilungsmodells künftige SP-Daten mit definitiver Wahrscheinlichkeit vermutet werden. Übungen zu Geostatistik 1 Theoretische Verteilungen Wahrscheinlichkeitsschätzungen auf Grundlage der angepassten Verteilungsfunktion Beispiel Normalverteilung u. Standardnormalverteilung (b) Ereignisschätzungen 2 Vorgehensweisen: - Wahrscheinlichkeit F(a) ist vorgegeben, zugehöriger Wert/Wertebereich (Werteintervall ∆a) wird geschätzt - Wert/Wertebereich (Werteintervall ∆a) ist vorgegeben, zugehörige Eintrittswahrscheinlichkeit F(a) wird geschätzt Übungen zu Geostatistik 1 Theoretische Verteilungen Wahrscheinlichkeitsschätzungen auf Grundlage der angepassten Verteilungsfunktion Beispiel Normalverteilung u. Standardnormalverteilung (b) Ereignisschätzungen In SPSS: (-> Transformieren -> Berechnen -> Funktionen) (1) CDF.Verteilung(Zahl, Parameter der Verteilung) – ergibt die Wahrscheinlichkeit, mit der eine Zufallsvariable (ZV), die der angegebenen Verteilung folgt, einen Wert kleiner oder gleich Zahl annimmt (Unterschreitungswahrscheinlichkeit). (2) IDF.Verteilung(Wahrscheinlichkeit, Parameter der Verteilung) – liefert den Wert, den eine der angegebenen Verteilung folgende ZV mit einer kumulierten Wahrscheinlichkeit von Wahrscheinlichkeit annimmt. SPSS berücksichtigt nur Unterschreitungswahrscheinlichkeiten!