Statistik I Übung – Statistik und Tabellenkalkulation? Statistik I Übung 7. Streuungsmaße II Göttingen 31. Mai 2007 Dozent: Jürgen Leibold 1 Statistik I Übung – Statistik und Tabellenkalkulation? Übersicht Lösung der Aufgabe Lagemaße Streuungsmaße Göttingen 31. Mai 2007 2 Statistik I Übung – Statistik und Tabellenkalkulation? Quartile Göttingen 31. Mai 2007 3 Statistik I Übung – Statistik und Tabellenkalkulation? Lösung der Aufgabe Göttingen 31. Mai 2007 4 Statistik I Übung – Statistik und Tabellenkalkulation? Lösung der Aufgabe Für die Variablen V50 u. V51 der Anmeldung.ods bzw. Anmeldung.xls jeweils den Mittelwert (arith.), Modus und Median ausgeben lassen Variation, Varianz und Standardabweichung unter Verwendung der unten stehenden Formel der Variation berechnen SSX = ( x1 − x ) + ( x 2 − x ) + K + ( x n − x ) 2 n = ∑ ( xi − x ) i =1 Göttingen 31. Mai 2007 2 2 2 n 2 = ∑ xi − n ⋅ x 2 i =1 Überprüfen Sie Ihr Ergebnis mit Hilfe der implementierten Funktionen „=VARIANZEN()“ und „=STABWN()“ . Lösung der Aufgabe 5 Statistik I Übung – Statistik und Tabellenkalkulation? Streuungsmaße II Beschreibung von Verteilungen Göttingen 31. Mai 2007 6 Statistik I Übung – Statistik und Tabellenkalkulation? Nominales Streuungsmaß Devianz und realtive Devianz sind mögliche Streuungsmaße für nominalskalierte Variablen. Ausprägung 1 2 3 4 5 Summe Ausprägung 1 2 3 4 5 Summe Göttingen 31. Mai 2007 A B 500 250 0 0 0 0 0 0 0 250 500 500 nka Devianza 500 0 0 0 0 500 0,000 0,000 0,000 0,000 0,000 0,000 C 100 100 100 100 100 500 nkb 250 0 0 0 250 500 Devianzb 346,57 0 0 0 346,57 693,14 nkc 100 100 100 100 100 500 Devianzc 321,88 321,88 321,88 321,8807 Tabellen.ods 321,88 Tabelle 1 1609,4 7 Statistik I Übung – Statistik und Tabellenkalkulation? Schiefe einer Verteilung V1 20 17,5 15 12,5 keine Schiefe = 0 10 7,5 5 2,5 re ch tssc hief = 20 V3 V2 0 20 0 17,5 15 12,5 10 7,5 5 1 2 17,5 15 pos. W 12,5 10 ert link 7,5 5 n = f e i h c s s t r e eg . W 2,5 2,5 0 0 0 Göttingen 31. Mai 2007 1 2 0 1 2 8 Statistik I Übung – Statistik und Tabellenkalkulation? Schiefe Hinweise auf die Schiefe (engl.: skewness) einer Verteilung gibt der Vergleich von Modus, Median und Mittelwert: • • • • für unimodale, symmetrische Verteilungen gilt: bei mehrgipfligen, symmetrischen Verteilungen gilt: bei einer rechtsschiefen Verteilung gilt: bei einer linksschiefen Verteilung gilt: Modus = Median = Mittelwert, Median = Mittelwert; Modus < Median < Mittelwert; Modus > Median > Mittelwert. n 1 3 ( xi − x ) ∑ n i =1 Schiefekoeff. = 3 sX Göttingen 31. Mai 2007 07 Tabellen.ods Tabelle 2 9 Statistik I Übung – Statistik und Tabellenkalkulation? Steilheit oder Wölbung V1 20 17,5 15 flach = neg. Wert 12,5 10 7,5 5 2,5 V3 V2 0 steil = pos. Wert 50 50 0 1 45 45 uförmig = flacher = neg. Wert 40 40 35 35 2 30 30 25 25 20 20 15 15 10 10 5 5 0 0 0 1 Göttingen 31. Mai 2007 2 3 4 5 0 6 1 2 3 4 5 6 10 Statistik I Übung – Statistik und Tabellenkalkulation? Steilheit ● ● Die Steilheit oder Wölbung (engl.: excess oder kurtosis) einer Verteilung wird über das 4. Moment gemessen Der Wert gibt die Stärke der Wölbung im Vergleich zur Normalverteilung an. n 1 4 ( xi − x ) ∑ n i =1 Steilheit = −3 4 sX Göttingen 31. Mai 2007 07 Tabellen.ods Tabelle 3 11 Statistik I Übung – Statistik und Tabellenkalkulation? Hinweis Die Interpretation ist nicht ganz einfach. Angewendet werden Schiefe- und Steilheitskoeffizienten in erster Linie in statistischen Tests, um zu prüfen, ob die Daten einer Stichprobe aus einer Normalverteilung kommen können. Göttingen 31. Mai 2007 12 Statistik I Übung – Statistik und Tabellenkalkulation? Aufgabe 1 Ohne Verwendung von Formeln für jeweils eine Variable aus dem Anmeldedatensatz die Devianz, die Schiefe und die Steilheit berechnen. Ergebnisse für Schiefe und Steilheit mit den implementierten Formeln kontrollieren. Göttingen 31. Mai 2007 13 Statistik I Übung – Statistik und Tabellenkalkulation? Aufgabe 2 Wiederholung der bisherigen Inhalte: Göttingen 31. Mai 2007 Datenaufbereitung Berechnungen Häufigkeiten Lagemaße Streuungsmaße 14