Prof. Dr. F. Marohn Übungen zur Statistik für Studierende der Sozialwissenschaften Wintersemester 2010/2011 Blatt 4 Mehr über Mittelwerte... Aufgabe 1: (Gewogenes arithmetisches Mittel, GAM) Das gewogene oder gewichtete arithmetische Mittel von n Zahlen x1 , . . . , xn ist definiert durch GAM = g1 · x1 + g2 · x2 + . . . + gn · xn = n X gi · xi i=1 Die Faktoren g1 , . . . , gn heißen Gewichte. Von den Gewichten wird nur verlangt, dass sie nicht negativ sind und die Summe 1 ergeben müssen: g1 + g2 + . . . + gn = 1 Im Spezialfall g1 = g2 = . . . = gn = 1/n (jede Beobachtung wird gleich gewichtet) ergibt sich das (gewöhnliche) arithmetische Mittel. (i) In einer Firma verdienen Frauen e20 pro Stunde und Männer e30 pro Stunde. Der Durchschnittsverdienst aller Mitarbeiter ist aber nicht notwendig e25. Wie lautet der Durchschnittsverdienst, wenn die Belegschaft dieser Firma aus 70 Frauen und 30 Männer besteht? (ii) Für 4 Schulklassen, in denen sich 20, 25, 28 und 32 Schüler befinden, ergaben sich (in dieser Reihenfolge) die folgenden durchschnittlichen Abwesenheitszeiten (in Stunden) pro Monat: 4, 7, 2 und 11. Wie hoch ist die durchschnittliche Abwesenheitszeit aller Schüler? Wie lauten in (i) bzw. (ii) die Gewichte? Aufgabe 2: Angenommen, eine Gemeinde hatte folgende Bevölkerungsentwicklung: Bevölkerung absoluter WachstumsZuwachs rate 1000 – – 1200 200 0.2 1500 300 0.25 1000 −500 −0.33 1 Wachstumsrate in % – 20% 25% −33% Wachstumsfaktor – 1.2 1.25 0.67 Es gilt: Wachstumsrate = neuer Wert – alter Wert alter Wert und Wachstumsfaktor = Wachstumsrate + 1 neuer Wert alter Wert (i) Berechnen Sie das arithmetische Mittel der absoluten Bevökerungszuwächse. = (ii) Es soll die durchschnittliche Wachstumsrate und der durchschnittliche Wachstumsfaktor der Bevölkerung bestimmt werden. Verwenden Sie dazu das arithmetische Mittel. Was fällt auf? Hilft hier der Median als Durchschnittswert weiter? (iii) Der sachlich richtige Durchschnitt von Wachstumsfaktoren ist das geometrische Mittel. Allgemein ist das geometrische Mittel von n positiven Zahlen x1 , . . . , xn gegeben durch √ GM = x̄G = n x1 · x2 · . . . · xn Berechnen Sie den durchschnittlichen Wachstumsfaktor bei der Bevölkerung. (iv) Zum durchschnittlichen Wachstumsfaktor gehört die durchschnittliche Wachstumsrate: durchschnittl. Wachstumsrate = durchschnittl. Wachstumsfaktor − 1 Bezeichnen r1 , . . . , rn die Wachstumsraten von n Perioden, so berechnet sich die durchschnittliche Wachstumsrate gemäß der Formel p n (r1 + 1) · (r2 + 1) · . . . · (rn + 1) − 1 Wie lautet die durchschnittliche Wachstumsrate der Bevölkerung? Aufgabe 3: Konzentrationsmaße Trotz vieler positiver Eigenschaften von Streuungsmaßen sind diese auf einem Auge völlig blind: Sie sehen zwar die Streuung, aber nicht die Ungleichheit. Angenommen, in einem Dorf beträgt das Einkommen von drei Landwirten e1000, e2000 und e7000. Wie groß ist die Einkommensungleichheit? Ein Streuungsmaß wie die Standardabweichung ist als Maß für die Ungleichheit kaum geeignet. 2 (i) Berechnen Sie die Standardabweichung. (ii) Angenommen, die EU subventioniert jeden Landwirt mit e30000. Die Einkommen der drei Landwirte betragen also dann e31000, e32000 und e37000. Die Ungleichheit hat nach dem üblichen Verständnis abgenommen. Berechnen Sie die Standardabweichung dieser Einkommen. Man stellt sich daher die Frage: Welcher Anteil der gesamten Merkmalssumme fällt auf den Ärmsten, welcher Anteil auf die zweit Ärmsten, etc. Vor der EU–Subvention ergeben sich die folgenden Paare: (0, 0), (1/3, 0.1), (2/3, 0.3), (1, 1) An erster Stelle steht der Anteil der so-und-soviel ärmsten Merkmalsträger, an zweiter Stelle deren Anteil an der gesamten Merkmalssumme. Diese Punkte, in einem (rechtwinkligen) Koordinatensystem übertragen und mit einer Geraden verbunden, heißt Lorenz–Kurve. Je gleichmäßiger die Verteilung ist, desto enger schmiegt sich die Lorenz–Kurve an die 45◦ –Linie (Diagonale) an, die die Punkte (0, 0) und (1, 1) verbindet. Als Maß für die Ungleichheit bietet sich daher die (Konzentrations–)Fläche zwischen der Lorenz–Kurve und der 45◦ –Linie an. Das bei weitem populärste Maß für Ungleichheit ist der Gini–Koeffizient G (auch Lorenzsches Konzentrationsmaß genannt): G = Fläche zwischen Diagonale und Lorenz–Kurve Fläche zwischen Diagonale und Absizze = 2 · Fläche zwischen Diagonale und Lorenz–Kurve Sind allgemein n Merkmalsträger und die Paare (0, 0), (1/n, v1 ), . . . , ((n − 1)/n, vn−1 ), (1, 1) gegeben (j/n · 100% der Ärmsten haben einen Anteil von vj · 100%), so folgt aus der Trapezregel die einfache Formel n G=1− 1X (vj−1 + vj ) n j=1 wobei v0 = 0 und vn = 1. (iii) Zeichnen Sie die Lorenz–Kurven für die Einkommensverteilung vor und nach der EU–Subvention. (iv) Berechnen Sie die Gini–Koeffizienten. Hat die Konzentration abgenommen? 3