Übungen zu Geostatistik 1 Deskriptive Statistik Menü -> Analysieren -> Deskriptive Statistiken <- erster Schritt der Datenanalyse: <- Überblick der Werteverteilung der Variablen (Empirische Häufigkeitsverteilung) - Beschreibung der Stichprobe(n-Häufigkeitsverteilung) <- Ermittlung deskriptiver Maßzahlen (Mittelungsmaße, Variationsmaße, Formparameter) <- Graphische Darstellung der empirischen Verteilung (Balkendiagramm, Histogramm, ...) Übungen zu Geostatistik 1 Deskriptive Statistik Menü -> Analysieren -> Deskriptive Statistiken -> Prozeduren: (1) Häufigkeiten (2) Deskriptive Statistiken (3) Explorative Datenanalyse (4) Kreuztabellen (Häufigkeiten für Variablenkombinationen) Übungen zu Geostatistik 1 Deskriptive Statistik Menü -> Analysieren -> Deskriptive Statistiken -> Prozeduren: (1) Häufigkeiten (2) Deskriptive Statistiken teils redundante Funktionen ! (3) Explorative Datenanalyse (4) Kreuztabellen (Häufigkeiten für Variablenkombinationen) Übungen zu Geostatistik 1 Deskriptive Statistik Menü -> Analysieren -> Deskriptive Statistiken -> Prozeduren: (1) Häufigkeiten - Häufigkeitsauszählungen - Verteilungskennwerte - Visualisierungen Übungen zu Geostatistik 1 Deskriptive Statistik Menü -> Analysieren -> Deskriptive Statistiken -> Prozeduren: (2) Deskriptive Statistiken Besonderheit: - z-Transformation von Variablen Übungen zu Geostatistik 1 Deskriptive Statistik Menü -> Analysieren -> Deskriptive Statistiken -> Prozeduren: (3) Explorative Datenanalyse - vielseitigste Prozedur zur deskriptiven Statistik - getrennte Analysen für Gruppen von Fällen <- Gruppierungsvariable - zusätzliche univariate Statistiken (Konfidenzintervalle, M-Schätzer, ...) - verschiedene Visualisierungsmöglichkeiten (Boxplots, Stem and Leaf-Plots, Histogramme, Normalverteilungsplots) - Testverfahren: Anpassungstests (Lilliefors-Test), Varianzhomogenität Übungen zu Geostatistik 1 Deskriptive Statistik Menü -> Analysieren -> Deskriptive Statistiken -> Prozeduren: (4) Kreuztabellen (Häufigkeiten für Variablenkombinationen) - Häufigkeitsauszählungen für mehrere Variablen und deren Kombinationen Übungen zu Geostatistik 1 Deskriptive Statistik Menü -> Analysieren -> Deskriptive Statistiken Graphische Darstellung der Häufigkeitsverteilung: Darstellungsmöglichkeiten Histogramm (1) Histogrammplot 25 Häufigkeit 20 15 10 Schätzung der Klassenanzahl K in Abhängigkeit vom SP-Umfang: z.B. Sturges (1926) K = 1 + 3.32 lg n 5 Mean = -0,7254 Std. Dev. = 2,85491 N = 216 0 -6,00 -3,00 Januar 0,00 3,00 Übungen zu Geostatistik 1 Deskriptive Statistik Menü -> Analysieren -> Deskriptive Statistiken Graphische Darstellung der Häufigkeitsverteilung: Darstellungsmöglichkeiten (2) Stem and Leaf Plot Januar Stem-and-Leaf Plot Frequency Stem & 3.00 Extremes 4.00 -7 . 4.00 -6 . 6.00 -5 . 16.00 -4 . 14.00 -3 . 18.00 -2 . 24.00 -1 . 33.00 -0 . 32.00 0 . 23.00 1 . 24.00 2 . 9.00 3 . 5.00 4 . 1.00 5 . Stem width: Each leaf: Leaf (=<-8.1) 0237 3568 003445 0012223345788888 00222234477788 000012234444456788 000011122344445555567789 000011222233344555566777888889999 00011233444445566666777777888899 00011112334555666778899 000000123445566667788899 222455678 12466 0 1.00 1 case(s) Übungen zu Geostatistik 1 Deskriptive Statistik Menü -> Analysieren -> Deskriptive Statistiken Graphische Darstellung der Häufigkeitsverteilung: Darstellungsmöglichkeiten 6,00 (3) Box-Plot Größter Wert, der nicht als Ausreisser klassifiziert wird 3,00 75%-Perzentil 0,00 Median (50%-Perzentil) 25%-Perzentil -3,00 Ausreißer: Ausreißer sind Werte, deren Abstand vom 25%-Perzentil nach unten bzw. vom 75%-Perzentil nach oben zwischen dem 1,5fachen und dem 3fachen der Boxhöhe liegt. Die Boxhöhe gibt den Abstand zwischen dem 25%- und dem 75%-Perzentil wieder. Extreme Werte: Der Abstand extremer Werte von dem 25%- oder dem 75%-Perzentil beträgt mehr als das Dreifache der Boxhöhe. -6,00 Kleinster Wert, der nicht als Ausreisser klassifiziert wird -9,00 Ausreisserwerte (u. Fallnummer) 1 Januar Übungen zu Geostatistik 1 Deskriptive Statistik Menü -> Analysieren -> Deskriptive Statistiken Deskriptive Maßzahlen: (1) Mittelungsmaße - Arithmetischer Mittelwert - Modus (Modalwert, Gipfelwert) - Median (Zentralwert) - Quantile (Lokalisationsmaße) Übungen zu Geostatistik 1 Deskriptive Statistik Menü -> Analysieren -> Deskriptive Statistiken Deskriptive Maßzahlen: (2) Variationsmaße - Variationsbreite (Spannweite, ...) - Varianz s2 = b=amax −amin 1 2 ai − a ∑ n−1 - Standardabweichung s= 1 2 a − a ∑ i n−1 s s v= 100 a a - Variationskoeffizient / prozentuale Standardabweichung v= - Quartilabstände IQR=Qu3−Qu1 Übungen zu Geostatistik 1 Deskriptive Statistik Menü -> Analysieren -> Deskriptive Statistiken Deskriptive Maßzahlen: (3) Formparameter - Schiefe a −Mod Sf = s - Exzeß (Wölbung, Kurtosis) Qu3−Qu1 Ex= 2De9−De1 (Schönwiese 1992)