Arithmetisches Mittel 2. Mittelwerte (Lageparameter) Beispiele aus dem täglichen Leben Beispiel: Pro Heimspiel hatte Borussia Dortmund in der letzten Saison durchschnittlich 74.624 Zuschauer. 3,3, 4, 4, 4, 6 x 1 3 3 4 4 4 6 6 ª «x ¬ Die deutschen Aktien sind im Durchschnitt um 10 Zähler gefallen. x In Indien wurde in den letzten 10 Jahren eine durchschnittliche Wachstumsrate der Bevölkerung von 20% verzeichnet. Der neue BMW Z4 verbraucht durchschnittlich 12 Liter auf 100 km. ª «x ¬ x 6 x 24 6 x 4 x 6 12 6 6 6 6 4 1 n º ¦ xi » ni1 ¼ 1 2 3 3 4 6 6 º 1 r ¦ H j aj » n j1 ¼ 1 3 2 3 4 6 6 6 6 ª «x ¬ Dortmunder Pommesbuden erhielten bei einer Bewertung durch französische Gourmet-Experten im Mittel 4 Sterne. n xi r ¦h j 1 j 4 º aj» ¼ Achtung: … 2. Mittelwerte (Lageparameter) - 13 - 2. Mittelwerte (Lageparameter) - 14 - Situation: x Ein Gebäude mit 10 Stockwerken x Ein Aufzug x Sie stehen im 2. Stock und warten auf den Aufzug x Bekannt: o vom 2. Stockwerk nach ganz oben und zurück braucht der Aufzug 200 Sekunden o vom 2. Stockwerk nach ganz unten und zurück braucht der Aufzug 50 Sekunden x Gesucht: Mittlere Wartezeit im 2. Stock o Wenn der Aufzug oben ist: Mittlere Wartezeit = 200/2 = 100 Sekunden o Wenn der Aufzug unten ist: Mittlere Wartezeit = 50/2 = 25 Sekunden o D.h. mittlere Wartezeit insgesamt = (100+25)/2 = 62,5 Sek. FALSCH!!! x Denn der Aufzug ist mit Wahrscheinlichkeit 200/250 = 0,8 oben 50/250 = 0,2 unten x Deshalb ist die mittlere Wartezeit 0,8 • 100 + 0,2 • 25 = 85 Sekunden x Richtige Lösung: n xg Gewogenes arithmetisches Mittel ¦ g i xi i 1 mit 0 d g i d 1 und n ¦ gi 1 i 1 2. Mittelwerte (Lageparameter) - 15 - 2. Mittelwerte (Lageparameter) - 16 - Situation: x Kauf einer Aktie für 100,- € x Kursverlauf über zwei Jahre: Kurs Kauf 1. Jahr 2. Jahr 100,- € 160,- € 80,- € Wachstumsrate ri x Gesucht: + 60% - 50% Durchschnittliche Wachstumsrate pro Jahr r1 r2 2 r 60 % 50 % 2 5% BLÖDSINN!!! (Positive mittlere Wachstumsrate und trotzdem Verlust) x Richtige Lösung: Geometrisches Mittel 1 x geo n x1 x2 ... xn § n ·n ¨ xi ¸ ¸ ¨ ©i1 ¹ x Anzuwenden, falls das beobachtete Merkmal als Wachstumsrate vorliegt 2. Mittelwerte (Lageparameter) - 17 - 2. Mittelwerte (Lageparameter) - 18 - Situation: x Planung des Bier-Catering für die nächste Skatrunde o Betrachtetes Merkmal: X = benötigte Trinkzeit für zwei Flaschen Bier o Von den drei Skatspielern ist bekannt: x1 = 9 Minuten x2 = 12 Minuten x3 = 18 Minuten x Gesucht: Durchschnittliche Trinkzeit für zwei Flaschen Bier x x Richtige Lösung: 1 (9 12 18) 13 3 ist falsch!!! Harmonisches Mittel r xh ¦H n n ¦ i 1 j j 1 1 xi r ¦H j 1 j 1 aj Anzuwenden, falls das beobachtete Merkmal als Quotient vorliegt (km/h, €/Stück, usw.) x Hier: xh 3 1 9 1 12 3 1 18 20 15 10 180 3 180 45 12 min./2 Fl. 2. Mittelwerte (Lageparameter) - 19 - 2. Mittelwerte (Lageparameter) - 20 - „Veranstaltungskritik“ am Ende des Semesters: Urteil Häufigkeit schlecht langweilig erträglich interessant aufregend 2 5 4 4 2 Gesucht: Durchschnittliche Bewertung Skalenniveau: Nominal → Mittelwert: Modus, die am häufigsten vorkommende Ausprägung = langweilig Aber: Durch die Bewertung ist eine „natürliche“ Rangfolge gegeben. Urteil schlecht langweilig erträglich interessant aufregend Häufigkeit x(i) 2 5 4 4 2 x(1), x(2) x(3) - x(7) x(8) - x(11) x(12) - x(15) x(16), x(17) Skalenniveau: Ordinal → Mittelwert: Median, der „Mittlere“ der der Größe nach geordneten Beobachtungen x(1), …, x(17) = x(9) = erträglich Median allgemein: x0 ,5 min {x : Fn ( x ) t 0,5} auch x M ed x 2. Mittelwerte (Lageparameter) - 21 - 2. Mittelwerte (Lageparameter) - 22 - Nachteil des Medians gegenüber dem arithmetischen Alternatives Vorgehen bei „offensichtlichen“ Mittel: Ausreißern: ¾ Voraussetzung: ¾ Information wird verschenkt: Es wird nur der „mittlere“ Wert der Stichprobe berücksichtigt. Alle anderen Werte haben keinen Einfluss. Angenommen, Durchschnittseinkommen (arithmetisches Mittel) und Bevölkerungszahl (n) sind bekannt, dann ist auch das Gesamteinkommen bekannt (Produkt der beiden Werte). Aber aus dem Median und der Bevölkerungszahl ist kein Rückschluss auf das Gesamteinkommen möglich. Wie gesehen: Das arithmetische Mittel reagiert empfindlich gegenüber Ausreißerwerten. ¾ Lösung: α·100% der größten und α·100% der kleinsten Werte des Datensatzes werden weggelassen. D @ 0; 0.25@ . In der Regel ¾ Bezeichnung: α·100%-getrimmtes Mittel xD ¾ Im Beispiel: Vorteile des Medians gegenüber dem arithmetischen Mittel: Der Größe nach geordnete Daten (mit Eingabefehler): x(i ) : 0,8 0,9 1,0 1,2 1,2 ¾ eine vorkommende Merkmalsausprägung 1,3 1,3 1,3 1,4 16 ¾ kann auch bei ordinal skalierten Merkmalen angewendet werden 10%-getrimmtes Mittel → ¾ ausreißerrobust, z.B. Metrisch skalierte Daten. n = 10: α = 0,1 → xD x 0 ,1 n = 10: 10% kleinste Werte = Minimum (0,8) weglassen, 10% größte Werte = Maximum (16) weglassen. xi : 1,2 0,8 1,3 1,0 1,4 1,3 1,6 1,2 0,9 1,3 Median = 1,2 arithmetisches Mittel = 1,2 x0,1 1 (0,9 1,0 ... 1,3 1,4) 8 1 9,6 1,2 8 aber Fehler bei der Dateneingabe, 16 statt 1,6: Median = 1,2 arithmetisches Mittel = 2,64 2. Mittelwerte (Lageparameter) - 23 - 2. Mittelwerte (Lageparameter) - 24 - Mittelwerte (Lageparameter) Quantile: Definition: Beispiele aus dem täglichen Leben Völlig analog zum Median min {x : Fn ( x ) t D } xD Pro Heimspiel hatte Borussia Dortmund in der letzten Saison durchschnittlich 74.624 Zuschauer. → Arithmetisches Mittel (gerundet) Die deutschen Aktien sind im Durchschnitt um 10 Zähler gefallen. → Gewogenes arithmetisches Mittel α·100%-Quantil x Wichtige Quantile ¾ 1. Quartil ¾ 3. Quartil ¾ 2. Quartil (unteres Quartil): x0,25 (oberes Quartil): x0,75 = Median: xmed = x0,5 Interquartilsabstand (Quartilsabstand) Q In Indien wurde in den letzten 10 Jahren eine durchschnittliche Wachstumsrate der Bevölkerung von 20% verzeichnet. → Geometrisches Mittel Der neue BMW Z4 verbraucht durchschnittlich 12 Liter auf 100 km. → Harmonisches Mittel Beispiel: x0 , 75 x0 , 25 Gegebene Daten: 1, 2, 4, 5, 6 ¾ 1. Schritt: Empirische Verteilungsfunktion zeichnen ¾ 2. Schritt: Quartile bestimmen ¾ 3. Schritt: Grafische Darstellung durch einen BOXPLOT Literatur zum Boxplot siehe z.B.: Fahrmeir, Künstler, Pigeot, Tutz: Seite 65 ff. Dortmunder Pommesbuden erhielten bei einer Bewertung durch französische Gourmet-Experten im Mittel 4 Sterne. → Median 2. Mittelwerte (Lageparameter) - 25 - 2. Mittelwerte (Lageparameter) - 26 - Vergleich von Beschleunigungszeiten bei PKWs 2. Mittelwerte (Lageparameter) - 27 - 2. Mittelwerte (Lageparameter) - 28 - Alternative Bestimmung der Quantile Platz für Notizen x1 ,..., xn Stichprobe: Der Größe nach geordnete Stichprobe: x(1) , x( 2 ) ,..., x( n ) ¾ xD x( n D ) , falls n·α eine natürliche Zahl ist; ¾ xD x([ nD ]1) , falls n·α keine natürliche Zahl ist. ¾ [n·α] ist die zu n·α nächst kleinere natürliche Zahl. Im Beispiel: ¾ α = 0,25 ¾ α = 0,75 ¾ α = 0,5 n = 5, → n·α = 1,25 → keine natürliche Zahl x([1, 25 ]1) x(11) x( 2 ) → x0 , 25 2 → n·α = 3,75 → keine natürliche Zahl x([ 3, 75 ]1) x ( 3 1) x( 4 ) → x0 , 75 5 → n·α = 2,5 → keine natürliche Zahl x([ 2 , 5 ]1) x( 2 1) x( 3) → x0 ,5 2. Mittelwerte (Lageparameter) 4 - 29 -