23.04.2016 Deskriptive Statistik Winfried Zinn © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR Inhalte Statistik 1 etrik 1. Themenblock: Grundlagen der beschreibenden Statistik: • Skalenniveaus • Häufigkeitsverteilungen • Mittelwerte (Lagemaße) • Standardabweichung und Varianzen (Streuungsmaße) • Korrelation (Zusammenhangsmaß) 23.04.2016 © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR Dateneingabe 23.04.2016 etrik letzte Körper- Augen- Schuh- Geburts- NasenName Vorname Mathegröße farbe größe datum länge note © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR Skalenniveaus etrik Skalenniveaus bestimmen den Informationsgehalt von Zahlen und Zahlenfolgen: 23.04.2016 N ominal O rdinal I ntervall R ational (Verhältniszahlen) © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR Übung 23.04.2016 Skalenniveau Beispiel für Merkmal Nominal Ordinal Intervall Rational / Verhältnis © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR etrik Häufigkeitsverteilung etrik 23.04.2016 Anzahl der Nennungen Zur Frage: Die tägliche Unterstützung des Pflegepersonals ist ... 150 124 105 100 50 0 47 45 Punktw ert 18 21 das Beste, w as ic h je erlebt habe sehr gut gut akzeptabel schlecht keine Angaben Anzahl Prozentder Nenw ert nungen 100 47 13 % 75 50 25 0 -- 124 105 45 18 21 34 29 13 5 6 Ihres Hauses Aller Häuser Mittlerer Punktw ert: 60 70 Vertrauensintervall in Punkten: 3 Standardabw eichung in Punkten: 22 Anzahl der gültigen Fälle 339 Anzahl aller Fälle: 360 © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR % % % % % Histogramm etrik Histogramm Balkendiagramm 8 30 Häufigkeit 6 20 4 10 2 0 0 83 80 77 72 69 64 62 57 54 52 49 46 44 42 40 37 35 33 31 29 27 24 20 18 23.04.2016 0 20 Alter 40 60 Alter © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR 80 100 Lagemaße etrik • Modalwert (Der häufigste Wert) • Median (Der Wert, der die Merkmalsliste in 2 gleichgroße Hälften teilt • Mittelwert Durchschnittswert 23.04.2016 © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR Lagemaße etrik Häufigkeit - Modalwert verteilung Mo Median Md Mittelwert M Nominal X X Ordinal X X X (x) Intervall X X X X X X X Rational 23.04.2016 (Histogramm) X © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR Median - Mittelwert 23.04.2016 etrik Dorf A Dorf B Bauer Müller 1 Kuh 1 Kuh Bauer Maier 2 Kühe 2 Kühe Bauer Schmitt 3 Kühe 3 Kühe Bauer Schulze 4 Kühe 10.000 Kühe Mittelwert 2,5 2501,5 Median 2,5 2,5 © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR Median – Mittelwert 2 23.04.2016 1. Noten Klasse A geordnet 3 1. Noten Klasse B geordnet 1 2. 3. 4. 3 3 3 4. 1 1 1 5. 6. 7. 8. 9. 3 3 3 3 3 5. 6. 7. 8. 9. 1 1 1 1 1 10. 3 10. 3 11. 12. 13. 14. 15. 16. 17. 18. 19. 6 6 6 6 6 6 6 6 6 11. 12. 13. 14. 15. 16. 17. 18. 19. 3 3 3 3 3 3 3 3 3 2. 3. Mittelwert: Median 4,4 3,0 Mittelwert: Median © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR 2,1 3,0 etrik Standardabweichung etrik Was ist der Unterschied? Ergebnis der Übungsarbeit Statistik 1: 23.04.2016 Note Fachhochschule 1 2 3 4 5 A 50 B 5 10 20 10 5 C 25 6 Mittelwert 25 Die Varianz ist die Standardabweichung mit sich selbst multipliziert © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR Varianz und Standardabweichung • Berechnen der Varianz: (Wert-Mittelwert)² aufsummiert, geteilt durch die Anzahl der Werte V= • Berechnen der Standardabweichung: Wurzel der Varianz 23.04.2016 V © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR etrik Korrelation etrik Die Korrelation beschreibt den Zusammenhang zwischen 2 Merkmalen, die gleichzeitig bei einem Merkmalsträger gemessen werden. 1. Fall proportional: 23.04.2016 Merkmal 2 (Körpergröße) (Gewicht ) Mayer 150 60 Müller 160 70 Schulze 170 80 Schmitt 180 90 Person 180 Größe Merkmal 1 170 160 150 60 70 KG © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR 80 90 Korrelation etrik Die Korrelation beschreibt den Zusammenhang zwischen 2 Merkmalen, die gleichzeitig bei einem Merkmalsträger gemessen werden. 2. Fall gegenproportional: 23.04.2016 Merkmal 2 (Körpergröße) (Gewicht ) Mayer 150 90 Müller 160 80 Schulze 170 70 Schmitt 180 60 Person 180 Größe Merkmal 1 170 160 150 60 70 KG © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR 80 90 Korrelation etrik Die Korrelation beschreibt den Zusammenhang zwischen 2 Merkmalen, die gleichzeitig bei einem Merkmalsträger gemessen werden. 3. Fall kein Zusammenhang 23.04.2016 Merkmal 2 (Körpergröße) (Gewicht ) Mayer 150 60 Müller 150 90 Schulze 180 60 Schmitt 180 80 Person 180 Größe Merkmal 1 170 160 150 60 70 KG © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR 80 90 Werte der Korrelation • Die Korrelation wird mit „r“ abgekürzt • Korrelation sind nie ein Begründungszusammenhang • Besondere Werte – Maximaler Wert ist 1 (proportional) – Minimale Wert ist –1 (gegenproportional) – Wert: 0 (ohne Zusammenhang) • In der Sozialwissenschaft werden bereits Werte mit r >0,4 interpretiert; ab r>0,6 hat spricht man von hohen Korrelationen • Das Quadrat der Korrelation ist der Anteil der erklärten Varianz 23.04.2016 – Z.B. r= 0,6 => Anteil der erklärten Varianz: 0,6 x 0,6 = 0,36 = 36 : 100 = 36% © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR etrik Arten der Korrelationen 23.04.2016 Skalen- Dichotom niveau (zweigeteilt) Dichotom Phi- (zweigeteilt) Koeffizient etrik Intervall Ordinal Rational Rang- Punkt- biseraler biserialer Koeffizient Koeffizient Kendall´s Ordinal Rang- Tau oder biseraler Rangkorrel- Koeffizient ation nach Spearman Intervall Punkt- + biserialer Rational Koeffizient + Kendall´s Tau/ Rang nach Spearmann Kendall´s Tau/ Rang nach Spearmann Pearson Koeffizient oder ProduktMoment Korrelation © Forschungsgruppe Metrik – Damm Deringer & Zinn GbR