Beispiele aus dem täglichen Leben

Werbung
Arithmetisches Mittel
2. Mittelwerte (Lageparameter)
Beispiele aus dem täglichen Leben
Beispiel:
™ Pro Heimspiel hatte Borussia Dortmund in der letzten Saison
durchschnittlich 74.624 Zuschauer.
3,3, 4, 4, 4, 6
x
1
˜ 3 3 4 4 4 6 6
ª
«x
¬
™ Die deutschen Aktien sind im Durchschnitt um 10 Zähler
gefallen.
x
™ In Indien wurde in den letzten 10 Jahren eine durchschnittliche Wachstumsrate der Bevölkerung von 20% verzeichnet.
™ Der neue BMW Z4 verbraucht durchschnittlich 12 Liter auf
100 km.
ª
«x
¬
x
6
x
24
6
x
4
x
6 12 6
6 6 6
4
1 n º
¦ xi »
ni1 ¼
1
˜ 2 ˜ 3 3 ˜ 4 6 6
º
1 r
¦ H j ˜ aj »
n j1
¼
1
3
2
˜3 ˜ 4 ˜6
6
6
6
ª
«x
¬
™ Dortmunder Pommesbuden erhielten bei einer Bewertung
durch französische Gourmet-Experten im Mittel 4 Sterne.
n
xi
r
¦h
j 1
j
4
º
˜aj»
¼
Achtung: …
2. Mittelwerte (Lageparameter)
- 13 -
2. Mittelwerte (Lageparameter)
- 14 -
Situation:
x
Ein Gebäude mit 10 Stockwerken
x
Ein Aufzug
x
Sie stehen im 2. Stock und warten auf den Aufzug
x Bekannt:
o vom 2. Stockwerk nach ganz oben und zurück braucht der
Aufzug 200 Sekunden
o vom 2. Stockwerk nach ganz unten und zurück braucht der
Aufzug 50 Sekunden
x
Gesucht:
Mittlere Wartezeit im 2. Stock
o Wenn der Aufzug oben ist:
Mittlere Wartezeit = 200/2 = 100 Sekunden
o Wenn der Aufzug unten ist:
Mittlere Wartezeit = 50/2 = 25 Sekunden
o D.h. mittlere Wartezeit insgesamt = (100+25)/2 = 62,5 Sek.
FALSCH!!!
x
Denn der Aufzug ist mit Wahrscheinlichkeit
200/250 = 0,8 oben
50/250 = 0,2 unten
x
Deshalb ist die mittlere Wartezeit
0,8 • 100 + 0,2 • 25 = 85 Sekunden
x Richtige Lösung:
n
xg
Gewogenes arithmetisches Mittel
¦ g i ˜ xi
i 1
mit 0 d g i d 1 und
n
¦ gi
1
i 1
2. Mittelwerte (Lageparameter)
- 15 -
2. Mittelwerte (Lageparameter)
- 16 -
Situation:
x Kauf einer Aktie für 100,- €
x Kursverlauf über zwei Jahre:
Kurs
Kauf
1. Jahr
2. Jahr
100,- €
160,- €
80,- €
Wachstumsrate ri
x Gesucht:
+ 60%
- 50%
Durchschnittliche Wachstumsrate pro Jahr
r1 r2
2
r
60 % 50 %
2
5%
BLÖDSINN!!!
(Positive mittlere Wachstumsrate und trotzdem Verlust)
x Richtige Lösung:
Geometrisches Mittel
1
x geo
n
x1 ˜ x2 ˜ ... ˜ xn
§ n ·n
¨ – xi ¸
¸
¨
©i1 ¹
x Anzuwenden, falls das beobachtete Merkmal als Wachstumsrate
vorliegt
2. Mittelwerte (Lageparameter)
- 17 -
2. Mittelwerte (Lageparameter)
- 18 -
Situation:
x Planung des Bier-Catering für die nächste Skatrunde
o Betrachtetes Merkmal:
X = benötigte Trinkzeit für zwei Flaschen Bier
o Von den drei Skatspielern ist bekannt:
x1 = 9 Minuten
x2 = 12 Minuten
x3 = 18 Minuten
x Gesucht:
Durchschnittliche Trinkzeit für zwei Flaschen Bier
x
x Richtige Lösung:
1
(9 12 18) 13
3
ist falsch!!!
Harmonisches Mittel
r
xh
¦H
n
n
¦
i 1
j
j 1
1
xi
r
¦H
j 1
j
˜
1
aj
Anzuwenden, falls das beobachtete Merkmal als
Quotient vorliegt (km/h, €/Stück, usw.)
x Hier:
xh
3
1
9
1
12
3
1
18
20 15 10
180
3 ˜ 180
45
12 min./2 Fl.
2. Mittelwerte (Lageparameter)
- 19 -
2. Mittelwerte (Lageparameter)
- 20 -
„Veranstaltungskritik“ am Ende des Semesters:
Urteil
Häufigkeit
schlecht
langweilig
erträglich
interessant
aufregend
2
5
4
4
2
Gesucht: Durchschnittliche Bewertung
Skalenniveau: Nominal
→ Mittelwert: Modus,
die am häufigsten vorkommende Ausprägung
= langweilig
Aber: Durch die Bewertung ist eine „natürliche“ Rangfolge gegeben.
Urteil
schlecht
langweilig
erträglich
interessant
aufregend
Häufigkeit
x(i)
2
5
4
4
2
x(1), x(2)
x(3) - x(7)
x(8) - x(11)
x(12) - x(15)
x(16), x(17)
Skalenniveau: Ordinal
→ Mittelwert: Median,
der „Mittlere“ der der Größe nach geordneten
Beobachtungen x(1), …, x(17)
= x(9) = erträglich
Median allgemein: x0 ,5
min {x  ƒ : Fn ( x ) t 0,5} auch x M ed
x
2. Mittelwerte (Lageparameter)
- 21 -
2. Mittelwerte (Lageparameter)
- 22 -
™ Nachteil des Medians gegenüber dem arithmetischen
™ Alternatives Vorgehen bei „offensichtlichen“
Mittel:
Ausreißern:
¾ Voraussetzung:
¾ Information wird verschenkt:
ƒ Es wird nur der „mittlere“ Wert der Stichprobe
berücksichtigt. Alle anderen Werte haben keinen Einfluss.
ƒ Angenommen, Durchschnittseinkommen (arithmetisches
Mittel) und Bevölkerungszahl (n) sind bekannt, dann ist
auch das Gesamteinkommen bekannt (Produkt der beiden
Werte).
ƒ Aber aus dem Median und der Bevölkerungszahl ist kein
Rückschluss auf das Gesamteinkommen möglich.
ƒ Wie gesehen: Das arithmetische Mittel reagiert
empfindlich gegenüber Ausreißerwerten.
¾ Lösung:
α·100% der größten und α·100% der kleinsten
Werte des Datensatzes werden weggelassen.
D  @ 0; 0.25@ .
In der Regel
¾ Bezeichnung:
α·100%-getrimmtes Mittel
xD
¾ Im Beispiel:
™ Vorteile des Medians gegenüber dem arithmetischen
Mittel:
ƒ Der Größe nach geordnete Daten (mit Eingabefehler):
x(i ) : 0,8 0,9 1,0 1,2 1,2
¾ eine vorkommende Merkmalsausprägung
1,3 1,3 1,3 1,4 16
¾ kann auch bei ordinal skalierten Merkmalen angewendet
werden
ƒ 10%-getrimmtes Mittel →
¾ ausreißerrobust,
z.B.
Metrisch skalierte Daten.
n = 10:
α = 0,1 → xD
x 0 ,1
ƒ n = 10: 10% kleinste Werte = Minimum (0,8) weglassen,
10% größte Werte = Maximum (16) weglassen.
xi : 1,2 0,8 1,3 1,0 1,4
1,3 1,6 1,2 0,9 1,3
Ÿ
ƒ Median = 1,2
ƒ arithmetisches Mittel = 1,2
x0,1
1
(0,9 1,0 ... 1,3 1,4)
8
1
˜ 9,6 1,2
8
aber Fehler bei der Dateneingabe, 16 statt 1,6:
ƒ Median = 1,2
ƒ arithmetisches Mittel = 2,64
2. Mittelwerte (Lageparameter)
- 23 -
2. Mittelwerte (Lageparameter)
- 24 -
Mittelwerte (Lageparameter)
Quantile:
™ Definition:
Beispiele aus dem täglichen Leben
Völlig analog zum Median
min {x  ƒ : Fn ( x ) t D }
xD
™ Pro Heimspiel hatte Borussia Dortmund in der letzten Saison
durchschnittlich 74.624 Zuschauer.
→ Arithmetisches Mittel (gerundet)
™ Die deutschen Aktien sind im Durchschnitt um 10 Zähler
gefallen.
→ Gewogenes arithmetisches Mittel
α·100%-Quantil
x
™ Wichtige Quantile
¾ 1. Quartil
¾ 3. Quartil
¾ 2. Quartil
(unteres Quartil):
x0,25
(oberes Quartil):
x0,75
= Median: xmed = x0,5
™ Interquartilsabstand (Quartilsabstand)
Q
™ In Indien wurde in den letzten 10 Jahren eine durchschnittliche Wachstumsrate der Bevölkerung von 20% verzeichnet.
→ Geometrisches Mittel
™ Der neue BMW Z4 verbraucht durchschnittlich 12 Liter auf
100 km.
→ Harmonisches Mittel
™ Beispiel:
x0 , 75 x0 , 25
Gegebene Daten: 1, 2, 4, 5, 6
¾ 1. Schritt: Empirische Verteilungsfunktion zeichnen
¾ 2. Schritt: Quartile bestimmen
¾ 3. Schritt: Grafische Darstellung durch einen BOXPLOT
ƒ Literatur zum Boxplot siehe z.B.:
Fahrmeir, Künstler, Pigeot, Tutz: Seite 65 ff.
™ Dortmunder Pommesbuden erhielten bei einer Bewertung
durch französische Gourmet-Experten im Mittel 4 Sterne.
→ Median
2. Mittelwerte (Lageparameter)
- 25 -
2. Mittelwerte (Lageparameter)
- 26 -
Vergleich von Beschleunigungszeiten bei PKWs
2. Mittelwerte (Lageparameter)
- 27 -
2. Mittelwerte (Lageparameter)
- 28 -
Alternative Bestimmung der Quantile
Platz für Notizen
x1 ,..., xn
™ Stichprobe:
™ Der Größe nach geordnete Stichprobe: x(1) , x( 2 ) ,..., x( n )
¾ xD
x( n ˜D ) , falls n·α eine natürliche Zahl ist;
¾ xD
x([ n˜D ]1) , falls n·α keine natürliche Zahl ist.
¾ [n·α] ist die zu n·α nächst kleinere natürliche Zahl.
™ Im Beispiel:
¾ α = 0,25
¾ α = 0,75
¾ α = 0,5
n = 5,
→ n·α = 1,25 → keine natürliche Zahl
x([1, 25 ]1)
x(11)
x( 2 )
→ x0 , 25
2
→ n·α = 3,75 → keine natürliche Zahl
x([ 3, 75 ]1)
x ( 3 1)
x( 4 )
→ x0 , 75
5
→ n·α = 2,5 → keine natürliche Zahl
x([ 2 , 5 ]1)
x( 2 1)
x( 3)
→ x0 ,5
2. Mittelwerte (Lageparameter)
4
- 29 -
Herunterladen