Arithmetisches Mittel
2. Mittelwerte (Lageparameter)
Beispiele aus dem täglichen Leben
Beispiel:
Pro Heimspiel hatte Borussia Dortmund in der letzten Saison
durchschnittlich 74.624 Zuschauer.
3,3, 4, 4, 4, 6
x
1
3 3 4 4 4 6 6
ª
«x
¬
Die deutschen Aktien sind im Durchschnitt um 10 Zähler
gefallen.
x
In Indien wurde in den letzten 10 Jahren eine durchschnittliche Wachstumsrate der Bevölkerung von 20% verzeichnet.
Der neue BMW Z4 verbraucht durchschnittlich 12 Liter auf
100 km.
ª
«x
¬
x
6
x
24
6
x
4
x
6 12 6
6 6 6
4
1 n º
¦ xi »
ni1 ¼
1
2 3 3 4 6 6
º
1 r
¦ H j aj »
n j1
¼
1
3
2
3 4 6
6
6
6
ª
«x
¬
Dortmunder Pommesbuden erhielten bei einer Bewertung
durch französische Gourmet-Experten im Mittel 4 Sterne.
n
xi
r
¦h
j 1
j
4
º
aj»
¼
Achtung: …
2. Mittelwerte (Lageparameter)
- 13 -
2. Mittelwerte (Lageparameter)
- 14 -
Situation:
x
Ein Gebäude mit 10 Stockwerken
x
Ein Aufzug
x
Sie stehen im 2. Stock und warten auf den Aufzug
x Bekannt:
o vom 2. Stockwerk nach ganz oben und zurück braucht der
Aufzug 200 Sekunden
o vom 2. Stockwerk nach ganz unten und zurück braucht der
Aufzug 50 Sekunden
x
Gesucht:
Mittlere Wartezeit im 2. Stock
o Wenn der Aufzug oben ist:
Mittlere Wartezeit = 200/2 = 100 Sekunden
o Wenn der Aufzug unten ist:
Mittlere Wartezeit = 50/2 = 25 Sekunden
o D.h. mittlere Wartezeit insgesamt = (100+25)/2 = 62,5 Sek.
FALSCH!!!
x
Denn der Aufzug ist mit Wahrscheinlichkeit
200/250 = 0,8 oben
50/250 = 0,2 unten
x
Deshalb ist die mittlere Wartezeit
0,8 • 100 + 0,2 • 25 = 85 Sekunden
x Richtige Lösung:
n
xg
Gewogenes arithmetisches Mittel
¦ g i xi
i 1
mit 0 d g i d 1 und
n
¦ gi
1
i 1
2. Mittelwerte (Lageparameter)
- 15 -
2. Mittelwerte (Lageparameter)
- 16 -
Situation:
x Kauf einer Aktie für 100,- €
x Kursverlauf über zwei Jahre:
Kurs
Kauf
1. Jahr
2. Jahr
100,- €
160,- €
80,- €
Wachstumsrate ri
x Gesucht:
+ 60%
- 50%
Durchschnittliche Wachstumsrate pro Jahr
r1 r2
2
r
60 % 50 %
2
5%
BLÖDSINN!!!
(Positive mittlere Wachstumsrate und trotzdem Verlust)
x Richtige Lösung:
Geometrisches Mittel
1
x geo
n
x1 x2 ... xn
§ n ·n
¨ xi ¸
¸
¨
©i1 ¹
x Anzuwenden, falls das beobachtete Merkmal als Wachstumsrate
vorliegt
2. Mittelwerte (Lageparameter)
- 17 -
2. Mittelwerte (Lageparameter)
- 18 -
Situation:
x Planung des Bier-Catering für die nächste Skatrunde
o Betrachtetes Merkmal:
X = benötigte Trinkzeit für zwei Flaschen Bier
o Von den drei Skatspielern ist bekannt:
x1 = 9 Minuten
x2 = 12 Minuten
x3 = 18 Minuten
x Gesucht:
Durchschnittliche Trinkzeit für zwei Flaschen Bier
x
x Richtige Lösung:
1
(9 12 18) 13
3
ist falsch!!!
Harmonisches Mittel
r
xh
¦H
n
n
¦
i 1
j
j 1
1
xi
r
¦H
j 1
j
1
aj
Anzuwenden, falls das beobachtete Merkmal als
Quotient vorliegt (km/h, €/Stück, usw.)
x Hier:
xh
3
1
9
1
12
3
1
18
20 15 10
180
3 180
45
12 min./2 Fl.
2. Mittelwerte (Lageparameter)
- 19 -
2. Mittelwerte (Lageparameter)
- 20 -
„Veranstaltungskritik“ am Ende des Semesters:
Urteil
Häufigkeit
schlecht
langweilig
erträglich
interessant
aufregend
2
5
4
4
2
Gesucht: Durchschnittliche Bewertung
Skalenniveau: Nominal
→ Mittelwert: Modus,
die am häufigsten vorkommende Ausprägung
= langweilig
Aber: Durch die Bewertung ist eine „natürliche“ Rangfolge gegeben.
Urteil
schlecht
langweilig
erträglich
interessant
aufregend
Häufigkeit
x(i)
2
5
4
4
2
x(1), x(2)
x(3) - x(7)
x(8) - x(11)
x(12) - x(15)
x(16), x(17)
Skalenniveau: Ordinal
→ Mittelwert: Median,
der „Mittlere“ der der Größe nach geordneten
Beobachtungen x(1), …, x(17)
= x(9) = erträglich
Median allgemein: x0 ,5
min {x : Fn ( x ) t 0,5} auch x M ed
x
2. Mittelwerte (Lageparameter)
- 21 -
2. Mittelwerte (Lageparameter)
- 22 -
Nachteil des Medians gegenüber dem arithmetischen
Alternatives Vorgehen bei „offensichtlichen“
Mittel:
Ausreißern:
¾ Voraussetzung:
¾ Information wird verschenkt:
Es wird nur der „mittlere“ Wert der Stichprobe
berücksichtigt. Alle anderen Werte haben keinen Einfluss.
Angenommen, Durchschnittseinkommen (arithmetisches
Mittel) und Bevölkerungszahl (n) sind bekannt, dann ist
auch das Gesamteinkommen bekannt (Produkt der beiden
Werte).
Aber aus dem Median und der Bevölkerungszahl ist kein
Rückschluss auf das Gesamteinkommen möglich.
Wie gesehen: Das arithmetische Mittel reagiert
empfindlich gegenüber Ausreißerwerten.
¾ Lösung:
α·100% der größten und α·100% der kleinsten
Werte des Datensatzes werden weggelassen.
D @ 0; 0.25@ .
In der Regel
¾ Bezeichnung:
α·100%-getrimmtes Mittel
xD
¾ Im Beispiel:
Vorteile des Medians gegenüber dem arithmetischen
Mittel:
Der Größe nach geordnete Daten (mit Eingabefehler):
x(i ) : 0,8 0,9 1,0 1,2 1,2
¾ eine vorkommende Merkmalsausprägung
1,3 1,3 1,3 1,4 16
¾ kann auch bei ordinal skalierten Merkmalen angewendet
werden
10%-getrimmtes Mittel →
¾ ausreißerrobust,
z.B.
Metrisch skalierte Daten.
n = 10:
α = 0,1 → xD
x 0 ,1
n = 10: 10% kleinste Werte = Minimum (0,8) weglassen,
10% größte Werte = Maximum (16) weglassen.
xi : 1,2 0,8 1,3 1,0 1,4
1,3 1,6 1,2 0,9 1,3
Median = 1,2
arithmetisches Mittel = 1,2
x0,1
1
(0,9 1,0 ... 1,3 1,4)
8
1
9,6 1,2
8
aber Fehler bei der Dateneingabe, 16 statt 1,6:
Median = 1,2
arithmetisches Mittel = 2,64
2. Mittelwerte (Lageparameter)
- 23 -
2. Mittelwerte (Lageparameter)
- 24 -
Mittelwerte (Lageparameter)
Quantile:
Definition:
Beispiele aus dem täglichen Leben
Völlig analog zum Median
min {x : Fn ( x ) t D }
xD
Pro Heimspiel hatte Borussia Dortmund in der letzten Saison
durchschnittlich 74.624 Zuschauer.
→ Arithmetisches Mittel (gerundet)
Die deutschen Aktien sind im Durchschnitt um 10 Zähler
gefallen.
→ Gewogenes arithmetisches Mittel
α·100%-Quantil
x
Wichtige Quantile
¾ 1. Quartil
¾ 3. Quartil
¾ 2. Quartil
(unteres Quartil):
x0,25
(oberes Quartil):
x0,75
= Median: xmed = x0,5
Interquartilsabstand (Quartilsabstand)
Q
In Indien wurde in den letzten 10 Jahren eine durchschnittliche Wachstumsrate der Bevölkerung von 20% verzeichnet.
→ Geometrisches Mittel
Der neue BMW Z4 verbraucht durchschnittlich 12 Liter auf
100 km.
→ Harmonisches Mittel
Beispiel:
x0 , 75 x0 , 25
Gegebene Daten: 1, 2, 4, 5, 6
¾ 1. Schritt: Empirische Verteilungsfunktion zeichnen
¾ 2. Schritt: Quartile bestimmen
¾ 3. Schritt: Grafische Darstellung durch einen BOXPLOT
Literatur zum Boxplot siehe z.B.:
Fahrmeir, Künstler, Pigeot, Tutz: Seite 65 ff.
Dortmunder Pommesbuden erhielten bei einer Bewertung
durch französische Gourmet-Experten im Mittel 4 Sterne.
→ Median
2. Mittelwerte (Lageparameter)
- 25 -
2. Mittelwerte (Lageparameter)
- 26 -
Vergleich von Beschleunigungszeiten bei PKWs
2. Mittelwerte (Lageparameter)
- 27 -
2. Mittelwerte (Lageparameter)
- 28 -
Alternative Bestimmung der Quantile
Platz für Notizen
x1 ,..., xn
Stichprobe:
Der Größe nach geordnete Stichprobe: x(1) , x( 2 ) ,..., x( n )
¾ xD
x( n D ) , falls n·α eine natürliche Zahl ist;
¾ xD
x([ nD ]1) , falls n·α keine natürliche Zahl ist.
¾ [n·α] ist die zu n·α nächst kleinere natürliche Zahl.
Im Beispiel:
¾ α = 0,25
¾ α = 0,75
¾ α = 0,5
n = 5,
→ n·α = 1,25 → keine natürliche Zahl
x([1, 25 ]1)
x(11)
x( 2 )
→ x0 , 25
2
→ n·α = 3,75 → keine natürliche Zahl
x([ 3, 75 ]1)
x ( 3 1)
x( 4 )
→ x0 , 75
5
→ n·α = 2,5 → keine natürliche Zahl
x([ 2 , 5 ]1)
x( 2 1)
x( 3)
→ x0 ,5
2. Mittelwerte (Lageparameter)
4
- 29 -