Wiederholung Statistik I Statistik für SozialwissenschaftlerInnen II – p.8 Konstanten und Variablen • Konstante: Merkmal hat nur eine Ausprägung • Variable: Merkmal kann mehrere Ausprägungen annehmen Statistik für SozialwissenschaftlerInnen II – p.9 Skalenniveaus • Nominalskala: Nur Informationen über Gleichheit/Ungleichkeit der Variablen • Ordinalskala: Zusätzlich Informationen über Relationen, also größer/kleiner als andere Ausprägung • Intervallskala: Zusätzlich Informationen über die Abstände der Messwerte • Verhältnisskala: Besitzt einen unveränderlichen, interpretierbaren Nullpunkt. Aussagen über Verhältnisse möglich. Statistik für SozialwissenschaftlerInnen II – p.10 Skalenniveaus: Zusammenfassung Skala Nominal Ordinal Intervall Verhältnis Identität Ränge Abstände Nullpunkt ja ja ja ja nein ja ja ja nein nein ja ja nein nein nein ja Statistik für SozialwissenschaftlerInnen II – p.11 Das Summenzeichen n X xi i=1 ist lediglich die verkürzte Schreibweise für eine Addition x1 + x2 + · · · + xn−1 + xn • 1 und n als untere und obere Summationsgrenzen • i als Summationsindex Statistik für SozialwissenschaftlerInnen II – p.12 Rechenregeln für die einfache Summe n X i=1 n X i=1 n X i=1 a=n∗a a ∗ xi = a ∗ (xi ± yi ) = n X i=1 (xi ∗ yi ) 6= n X i=1 n X i=1 n X xi i=1 xi ± xi ∗ n X yi i=1 n X yi i=1 Statistik für SozialwissenschaftlerInnen II – p.13 Die Doppelsumme Wird benutzt, um Tabellen/Matritzen zu beschreiben 1 2 i c P 1 2 j r x11 x21 xi1 xc1 x12 x22 xi2 xc2 x1j x2j xij xcj x1r x2r xir xcr x.1 x.2 x.j x.c P x1. x2. xi. xc. x.. Entspricht der Doppelsumme r X c X i=1 j=1 xij = x.. = x11 + x12 + · · · + xij + · · · + xrc Statistik für SozialwissenschaftlerInnen II – p.14 Lage- und Streuungsmaße • Dienen dazu, Verteilungen kompakt zu beschreiben • Abhängig vom Skalenniveau des Merkmals • Lagemaße: Zentrale Tendenz der Verteilung • Streuungsmaße: Breite“ der Verteilung ” Statistik für SozialwissenschaftlerInnen II – p.15 Lagemaße: Modalwert/Modus • Voraussetzung: Nominalskalenniveau • Gibt an, welche Ausprägung am häufigsten vorkommt • Beispiel: Modalwert der Religionszugehörigkeit Statistik für SozialwissenschaftlerInnen II – p.16 Beispiel: Modalwert Religion 1 2 3 4 5 6 Katholisch Evangelisch, nicht Freikirchlich Evangelisch, Freikirchlich Andere christl. Religion Andere nicht-christl. Religion Religionslos Gesamt Häufigkeit Prozent 1083 1070 56 57 99 745 34,8 34,4 1,8 1,8 3,2 24,0 3110 100,0 Quelle: Allbus 2000. Modalwert=1 Statistik für SozialwissenschaftlerInnen II – p.17 Lagemaße: Median • Voraussetzung: Ordinalskalenniveau • Teilt die Verteilung in der Hälfte • 50% der Fälle liegen unter, 50% über dem Median • Beispiel: Median der Schulbildung Statistik für SozialwissenschaftlerInnen II – p.18 Beispiel: Median Schulabschluss 1 2 3 4 5 6 ohne Abschluss Hauptschulabschluss Realschulabschluss Fachhochschulreife Abitur Anderer Abschluss Gesamt Häufigkeit Prozent kum. Prozente 95 1414 866 199 543 8 3,0 45,3 27,7 6,4 17,4 0,3 3138 100 3,0 48,3 76,0 82,4 99,7 100 Quelle: Allbus 2000. Medianklasse=3 Statistik für SozialwissenschaftlerInnen II – p.19 Lagemaße: Artihmetrisches Mittel • • • • • Voraussetzung: Metrisches Skalenniveau Der Wert, den alle Befragten im Durchschnitt aufweisen Nachteil: Kann durch Ausreißerwerte“ verzerrt werden ” Beispiel: Mittelwert der Haushaltsgröße Berechnung des arithmetischen Mittels nach n X 1 x̄ = f (xi ) ∗ xi n i=1 Statistik für SozialwissenschaftlerInnen II – p.20 Beispiel: Arithmetrisches Mittel Häufigkeit Prozente Kum. Prozente 575 18,49 18,49 2 Personen 1113 35,78 54,27 3 Personen 602 19,35 73,62 4 Personen 564 18,14 91,76 5 Personen 168 5,41 97,17 6 Personen 55 1,76 98,92 7 Personen 22 0,71 99,64 8 Personen 8 0,24 99,88 9 Personen 0 0,00 99,88 10 Personen 3 0,08 99,96 11 Personen 1 0,04 100,00 3110 100,00 1 Person Gesamt Quelle: Allbus 2000. n 1X x̄ = f (xi ) ∗ xi n i=1 Statistik für SozialwissenschaftlerInnen II – p.21 Streuungsmaße • Geben Auskunft über die Breite der Verteilung • Ist die Maßzahl klein, liegen die Werte nahe um den Mittelpunkt • Ist die Maßzahl groß, sind die Meßwerte über ein breites Spektrum verteilt • Abhängig vom Skalenniveau Berechnung von unterschiedlichen Streuungsmaßen Statistik für SozialwissenschaftlerInnen II – p.22 Streuungsmaße: Index der Diversität D • Voraussetzung: Nominalskalenniveau • Wahrscheinlichkeit, daß zwei zufällig gezogene Analyseeinheiten unterschiedliche Ausprägungen aufweisen • Berechung des Indexes der Diversität“ nach ” D =1− k X p(xi )2 i=1 • Variiert zwischen 0 und • Standardisierung für Vergleichszwecke: IQV = k−1/k D k−1/k Statistik für SozialwissenschaftlerInnen II – p.23 Streuungsmaße: Quartilsabstand QA • Voraussetzung: Ordinalskalenniveau • Differenz zwischen dem 1. Quartil (25%) und dem 3. Quartil (75%) • Berechnung der Quartile analog zum Median: 25 − Pu Q1 = U + ∗b PQ1 • 75 − Pu Q3 = U + ∗b PQ3 Berechnung des Quartilsabstandes nach QA = Q1 − Q3 Statistik für SozialwissenschaftlerInnen II – p.24 Streuungsmaße: Standardabweichung s • Voraussetzung: Metrisches Skalenniveau • Standardabweichung ist die Quadratwurzel der Varianz • Berechnung der Varianz nach Pn 2 (x − x̄) SAQ 1 2 i=1 = s = n n • SAQ ist die Summe der quadrierten Abweichungen von ” Mittelwert“ • Berechnung der Standardabweichung nach r √ SAQ 2 s= s = n Statistik für SozialwissenschaftlerInnen II – p.25