Auswertung univariater Datenmengen

Werbung
Auswertung univariater
Datenmengen - deskriptiv
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
1
Lage- und Streuungsparameter V
Bibliografie
¾
Prof. Dr. Kück;
Statistik, Vorlesungsskript
Abschnitt 6.1.3, 6.1.4, 6.1.5
¾
Bleymüller/Gehlert/Gülicher;
Statistik für Wirtschaftswissenschaftler
Verlag Vahlen
¾
Bleymüller/Gehlert;
Formeln, Tabellen und Programme
Verlag Vahlen
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
2
Lage- und Streuungsparameter V
1
Standardisierte Maßzahlen
Will man mehrere Eigenschaften (Merkmale) der Objekte
(Einheiten) miteinander vergleichen, ist es erforderlich,
die unterschiedlichen Merkmalsdimensionen
auszuschalten. Das geschieht mittels Standardisierung.
Die hier behandelten Formen der Standardisierung sind:
¾ z-Transformation
¾ 0,1-Standardisierung
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
3
Lage- und Streuungsparameter V
z-Transformation
Es gilt:
a −µ
zi = i
σ
Abweichung gegenüber dem
Mittel
Dabei bedeuten:
zi : neuer Wert
ai : alter Wert
µ : arithmetisches Mittel
σ : Standardabweichung
Die Differenz zwischen Merkmalswert und Mittelwert
im Zähler sowie die Standardabweichung im Nenner
haben die selbe Dimension, die sich wegkürzt. Durch
z-Transformation erhält man dimensionslose Daten.
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
4
Lage- und Streuungsparameter V
2
z-Transformation
Eigenschaften der standardisierten Werte zi:
¾ sie sind dimensionslose relative Abweichungen,
¾ das arithmetische Mittel ist Null, E(Z) = 0
¾ die Varianz hat den Wert Eins, V(Z) = 1
Gemessene Werte
Standardisierte Werte
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
0
ai
0
zi
5
Lage- und Streuungsparameter V
z-Transformation
Die standardisierten Werte zi sind anschaulicher als die
f(z)
Ausgangswerte ai, denn:
–1 < zi < 1
einfacher Streubereich
–2 < zi < 2
doppelter Streubereich
–3 < zi < 3
dreifacher Streubereich
-3
-2
-1
0
68,3%*
1
2
3
z
95,5%*
99,7%*
Abweichungen im einfachen Streubereich drücken
Normalität in den Abweichungen aus, Abweichungen im
dreifachen Streubereich sind eher unwahrscheinlich.
*Die angegebenen Wahrscheinlichkeiten gelten nur für die Normalverteilung!
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
6
Lage- und Streuungsparameter V
3
z-Transformation
Beispiel: Die standardisierten Merkmalswerte der Leistung der 250 Autos
weisen folgende Verteilung auf:
SPSS-Diagramm
Normalverteilungskurve
Std.abw. = 1,00
Mittel = 0,00
N = 250,00
00
4,
50
3,
00
3,
50
2,
00
2,
50
1,
00
1,
0
,5
00
0,
0
-,5
0
,0
-1
0
,5
-1
Z-Wert: Leistung [PS]
Ein Merkmalswert von 280 PS entspricht einem zi-Wert von 2,24; er liegt
außerhalb des zweifachen Streubereiches und ist somit auffällig abweichend vom
Mittelwert.
7
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
Lage- und Streuungsparameter V
z-Transformation
Beispiel: Stellt man die standardisierten Werte des Verbrauches dar, so ergibt
sich folgende Verteilung:
SPSS-Diagramm
40
Normalverteilungskurve
30
20
10
Std.abw. = 1,00
Mittel = 0,00
N = 250,00
0
25
3,
25
2,
75
2,
75
1,
25
1,
5
,7
5
5
5
,2
-, 2
25
75
5
,2
-, 7
-1
,
-2
,
-1
Z-Wert: Kraftstoffverbrauch durchschnittlich
Der VW Lupo mit einem Verbrauch von 4,3 l/100 km hat einen
standardisierten Wert von -2,17 , der Ford Mondeo 2,5i V6 hat einen z-Wert
von 2,8.
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
8
Lage- und Streuungsparameter V
4
z-Transformation - Beispiel
Beispiel: Wie sind einzelne Fahrzeuge hinsichtlich ihrer Leistungsausstattung
und ihrem Benzinverbrauch vergleichend zu beurteilen?
Z-Wert des
Verbrauchs
VW Lupo
-2,17
Ford Mondeo 2,5i V6
2,8
Volvo S80 2,4
0,25
Z-Wert der
Leistung
<
>
≈
-0,88
0,78
0,26
Analytische Interpretation: Bezüglich der 250 untersuchten Autos hat VW
Lupo sowohl eine unterdurchschnittliche Leistung als auch einen
unterdurchschnittlichen Verbrauch. Jedoch ist der Verbrauch deutlich geringer
als die Leistung im Vergleich zu den anderen 249 Autos. VW Lupo ist ein
Fahrzeug, das einen geringen Energieeinsatz je Leistung hat. Negativ fällt in
dieser Hinsicht Ford Mondeo auf, Volvo S80 ist „ausgeglichen“.
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
9
Lage- und Streuungsparameter V
z-Transformation - Beispiel
Beispiel: Vergleich zweier Messreihen in unterschiedlichen Wertebereichen:
Was erkennt
man daraus?
1
2
3
4
5
6
7
8
9
10
Mittelwert
Streuung
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
a (1)
1,8
2,1
4,7
1,6
2,5
1,3
2,8
3,2
4,4
3,6
2,8
1,1
a (2)
2314
2700
6043
2057
3214
1672
3600
4114
5657
4629
3600
1422
z (1)
-0,90
-0,63
1,72
-1,09
-0,27
-1,36
0,00
0,36
1,45
0,72
0,00
1,00
z (2)
-0,90
-0,63
1,72
-1,09
-0,27
-1,36
0,00
0,36
1,45
0,72
0,00
1,00
10
Lage- und Streuungsparameter V
5
0,1-Standardisierung
Eine weitere Standardisierungsmöglichkeit ist die Eingrenzung
des Wertebereiches [0….1) .
a i − a max
si =
a min − a max
Sind alle ai positiv, so liegen alle si zwischen o und 1.
Für den maximalen Merkmalswert amax nimmt die standardisierte Größe
si den Wert 0 an, für den minimalen Merkmalswert amin ist si gleich 1.
Man sieht somit deutlich Abweichungen gegenüber dem Höchstwert, der
zum Maßstab der Standardisierung gemacht wird.
Das ist bei Unternehmensvergleichen mit ökonomischen Kennzahlen
sinnvoll.
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
11
Lage- und Streuungsparameter V
0,1-Standardisierung von zwei Reihen - Beispiel
1
2
3
4
5
6
7
8
9
10
Minimum
Maximum
a (1)
1,8
2,1
4,7
1,6
2,5
1,3
2,8
3,2
4,4
3,6
1,3
4,7
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
a (2)
2314
2700
6043
2057
3214
1672
3600
4114
5657
4629
1672
6043
s (1)
0,85
0,76
0,00
0,91
0,65
1,00
0,56
0,44
0,09
0,32
1,00
0,00
s (2)
0,85
0,76
0,00
0,91
0,65
1,00
0,56
0,44
0,09
0,32
1,00
0,00
12
Lage- und Streuungsparameter V
6
Ausreißerproblematik
bei 0,1-Standardisierung - Beispiel
Beispiel: Würde Nils nicht 101 kg sondern ungesunde 146 kg wiegen,
hat die Änderung des Maximalwertes Auswirkung auf alle
standardisierten Werte:
Name
Nr. i
xi
si
Lisa
1
44
1,00
Anna
2
46
0,96
Antje Marie Dörte
3
4
5
50
54
56
0,89 0,82 0,79
Sven
6
69
0,56
Uwe
7
72
0,51
Kai
8
78
0,40
Jan
9
80
0,37
Nils
10
101
0,00
Name
Nr. i
xi
si
Lisa
1
44
1,00
Anna
2
46
0,98
Antje Marie Dörte
3
4
5
50
54
56
0,94 0,90 0,88
Sven
6
69
0,75
Uwe
7
72
0,73
Kai
8
78
0,67
Jan
9
80
0,65
Nils
10
146
0,00
Die gleiche Auswirkung hätte die Änderung des Minimalwertes – in
diesem Fall das Gewicht von Lisa. Die 0,1-Standardisierung ist daher
problematisch.
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
13
Lage- und Streuungsparameter V
Einführung Momente
Momente sind Maßzahlen für die Beurteilung eindimensionaler
Häufigkeitsverteilungen. Sie sind durchschnittliche potenzierte Abweichungen
der Merkmalswerte von einem Bezugspunkt.
Man unterscheidet folgende Arten zur Bildung der Momente:
¾ Gewöhnliche Momente mit dem Bezugspunkt Null
m r (0 ) =
1 N r
∑ xi
N i =1
¾ Zentrale Momente um den Bezugspunkt des
arithmetischen Mittels
m r (µ ) =
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
1 N
(x i − µ )r
∑
N i =1
14
Lage- und Streuungsparameter V
7
Momente, Schiefe und Wölbung
¾ Das gewöhnliche erste Moment mit dem Bezugspunkt
Null ist das arithmetische Mittel:
1 N
µ = m1 (0) = ∑ x 1i
N i =1
¾ Das 2., 3. und 4. zentrale Moment mit dem Bezugspunkt
des arithmetischen Mittel ergeben:
¾ die Varianz:
σ 2 = m 2 (µ ) =
¾ die Schiefe:
m 3 (µ ) =
1
N
¾ die Wölbung: m (µ ) = 1
4
1 N
(x i − µ )2
∑
N i =1
N
∑ (x
i =1
− µ)
i
− µ)
3
N
∑ (x
N
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
i
i =1
4
15
Lage- und Streuungsparameter V
Momente Schiefe und Wölbung
¾Die angegebenen Maße sind absolute Maßzahlen, welche
die jeweilige Dimension der Merkmalsausprägung in der
jeweiligen Potenz haben. (z. B. hat das Schiefemaß für die
Verteilung einer Zeitdauer in Stunden die Dimension
Stunden³)
¾Daher ergeben sich oft sehr hohe Werte, die für
praktische Auswertungen ungeeignet sind. Momente
werden deshalb auch als relative Maßzahlen angegeben.
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
16
Lage- und Streuungsparameter V
8
Momente Schiefe und Wölbung
Aussage dieser Momente:
¾Neben Lageparametern und Streuungsmaßen lässt sich
eine Häufigkeitsverteilung auch noch durch Parameter
beschreiben, welche die Form der Verteilung
charakterisieren. Hierzu gehören die Momente Schiefe
und Wölbung.
¾Schiefe- und Wölbungsmaße sind deshalb sinnvoll, weil
Häufigkeitsverteilungen trotz gleichem arithmetischen
Mittel und gleicher Standardabweichung
unterschiedliche Formen aufweisen können.
17
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
Lage- und Streuungsparameter V
Momente Schiefe und Wölbung - Beispiel
Beispiel: Folgende drei Häufigkeitsverteilungen haben bei gleichem arithmetischen
Mittel von 10 und gleicher Varianz von 6,4 unterschiedliche Formen:
1
2
Klassenmitte xi 4
0,1
f(xi)
6
0,1
8
0,2
10
0,5
12
0,2
14
0,1
16
0,1
Klassenmitte xi
f(xi)
6
0,2
8
0,2
10
0,3
12
0,2
14
0,2
16
0
4
0
0,6
0,5
0,4
0,3
0,2
0,1
0
0,4
0,3
0,2
0,1
0
0,5
3
Klassenmitte xi 4
0,1
f(xi)
6
0,1
8
0,2
10
0,3
12
0,4
14
0,1
16
0
0,4
0,3
0,2
0,1
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
0
18
Lage- und Streuungsparameter V
9
Momente Schiefe und Wölbung
1
2
0,6
0,5
0,4
0,3
0,2
0,1
0
3
0,4
0,5
0,3
0,4
0,2
0,3
0,2
0,1
0,1
0
0
1 und 2 sind symmetrische Verteilungen, wobei sich bei 1 die
Merkmalswerte stärker um den Mittelwert konzentrieren.
Die Verteilungen 1 und 2 unterscheiden sich in ihrer Steilheit.
Verteilung 3 ist asymmetrisch, konkret: linksschief (rechtssteil).
Die Steilheit der Verteilung wird durch das Maß der Wölbung ausgewiesen.
Die Asymmetrie wird durch das Maß der Schiefe ausgewiesen.
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
19
Lage- und Streuungsparameter V
Schiefe (skewness)
Eine Verteilung ist symmetrisch, wenn es eine
Symmetrieachse gibt, so dass linke und rechte Hälfte der
Verteilung spiegelbildlich sind:
0,3
0,25
0,2
0,15
0,1
0,05
0
Bei empirischen Verteilungen ist exakte Symmetrie selten!
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
20
Lage- und Streuungsparameter V
10
Schiefe (skewness)
¾Eine Verteilung ist rechtsschief bzw.
linkssteil, wenn der überwiegende Teil
der Daten linksseitig lokalisiert ist, d.h.
kleine Merkmalsausprägungen große
Häufigkeiten haben.
0,50
0,40
0,30
0,20
0,10
0,00
1
¾Eine Verteilung ist linksschief bzw.
rechtssteil, wenn der überwiegende
Teil der Daten rechtsseitig lokalisiert
ist, d.h. große Merkmalsausprägungen
große Häufigkeiten haben.
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
2
3
4
5
6
7
0,25
0,2
0,15
0,1
0,05
0
21
Lage- und Streuungsparameter V
Absolutes Schiefemaß (skewness)
Das absolute Schiefemaß ist wie folgt definiert:
1 N
3
m 3 (µ ) = ∑ (x i − µ )
N i =1
Das Schiefemaß ist das Mittel der kubierten Abweichung der Einzelwerte
vom Mittel. Da durch die 3. Potenz das Vorzeichen der Abweichung
erhalten bleibt, kürzen sich bei symmetrischen Verteilungen die
Abweichungen weg; bei asymmetrischen Verteilungen wird jedoch ein
Schiefemaß größer oder kleiner Null ausgewiesen.
Bei rechtsschiefer Verteilung ist das Maß positiv,
bei symmetrischer Verteilung ist das Maß Null,
bei linksschiefer Verteilung ist das Maß negativ.
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
22
Lage- und Streuungsparameter V
11
Relatives Schiefemaß (skewness)
Das absolute Schiefemaß ist umso größer, je größer die
Streuung der Merkmalswerte ist. Um die Schiefe
verschiedener Verteilungen zu vergleichen, empfiehlt sich eine
Normierung.
Analog zum Variationskoeffizienten erhält man ein relatives
Maß:
Relatives Schiefemaß:
(drittes Standardmoment)
m *3 (µ ) =
m 3 (µ )
σ³
Das relative Schiefemaß ist eine dimensionslose Größe,
welche die relative Abweichung von der Symmetrie indiziert.
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
23
Lage- und Streuungsparameter V
Schiefemaß (skewness) - Beispiel
Beispiel: Für die 250 untersuchten Autos soll die Verteilung des
Anschaffungspreises mit der Verteilung des Kraftstoffverbrauches
verglichen werden:
60
SPSS-Diagramm
40
50
30
40
30
20
20
10
Std.abw. = 26500,57
10
Mittel = 42609,9
Std.abw . = 1,81
N = 250,00
0
N = 250,00
0
,0
14,50
13,00
13,50
12,00
12,50
11,00
11,50
10,00
10
50
9, 0
0
9, 0
5
8, 0
0
8, 0
5
7, 0
0
7, 0
5
6, 0
0
6, 0
5
5, 0
0
5, 0
5
4,
,0
00
00
21 0,0
0
00
19 0,0
0
00
17 0,0
0
00
15 0,0
0
00
13 0,0
0
00
11 ,0
0
00
90 ,0
0
00
70 ,0
0
00
50 ,0
0
00
30 ,0
0
00
10
Preis [DM]
Mittel = 8,22
0
Kraftstoffverbrauch durchschnittlich [l/100km]
Um die unterschiedlich dimensionierten
Merkmale miteinander vergleichen zu können,
wird das relative Schiefemaß verwendet:
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
m*3 (µ ) =
m3 (µ )
σ³
24
Lage- und Streuungsparameter V
12
Schiefemaß (skewness) - Beispiel
Beispiel: Für die 250 untersuchten Autos soll die Verteilung des
Anschaffungspreises mit der Verteilung des Kraftstoffverbrauches
verglichen werden:
40
60
30
50
40
20
30
20
10
10
Std.abw . = 1,81
Std.abw. = 26500,57
Mittel = 8,22
Mittel = 42609,9
N = 250,00
0
N = 250,00
0
0
,0
14,50
13,00
13 50
,
12,00
12,50
11 00
,
11,50
10,00
10 0
5
9, 0
9,00
5
8, 0
0
8, 0
7,50
0
7,
50
6, 0
0
6, 0
5,50
0
5, 0
5
4,
,0
00
00
21 0,0
0
00
19 0,0
0
00
,0
17
00
00
15 0,0
0
00
13 0,0
0
00
11 ,0
0
00
90 ,0
0
00
70
0
0,
00
50 ,0
0
00
30 ,0
0
00
10
Kraftstoffverbrauch durchschnittlich [l/100km]
Preis [DM]
m *3 (µ )Preis = 2,935
m *3 (µ )Verbrauch = 0,668
Der optische Eindruck – die Verteilung der Anschaffungspreise ist
stärker asymmetrisch als die Verteilung des Kraftstoffverbrauches –
wird durch das relative Schiefemaß bestätigt.
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
25
Lage- und Streuungsparameter V
Wölbung (Exzess, Kurtosis)
Maßzahlen der Wölbung sollen charakterisieren, wie stark
oder schwach der zentrale Bereich und die Randbereiche
der Verteilung besetzt sind.
Verteilungen mit gleicher Streuung können
unterschiedliche Wölbungen besitzen.
0,6
0,5
0,4
0,3
0,2
0,1
0
0,4
0,3
0,2
0,1
0
Trotz gleicher Varianz weisen die beiden symmetrischen
Verteilungen unterschiedliche Wölbungen auf.
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
26
Lage- und Streuungsparameter V
13
Absolutes Wölbungsmaß (Exzess, Kurtosis)
Die absolute Wölbung ist wie folgt definiert:
1 N
4
m 4 (µ ) = ∑ (x i − µ )
N i =1
Das Wölbungsmaß ist aufgrund der vierten
Potenz stets positiv. Ausnahme: alle
Merkmalswerte sind gleich, es existieren
keine Abweichungen vom Mittelwert.
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
27
Lage- und Streuungsparameter V
Relatives Wölbungsmaß (Exzess, Kurtosis)
Die relative Wölbung wird im Vergleich zur Standardnormalverteilung
definiert, deren Wölbungsmaß 3 ergibt. Der Wert Null für das
modifizierte relative Wölbungsmaß indiziert die Normalverteilung.
Modifiziertes relatives Wölbungsmaß:
m *4 (µ ) =
m 4 (µ )
−3
σ4
!
Das modifizierte relative Wölbungsmaß kann analog zur Schiefe ein
positives oder negatives Vorzeichen haben oder im Fall der
Normalverteilung Null sein.
• m*4(µ) = 0, Normalverteilung
• m*4(µ) > 0, Maximum der Verteilung größer als NV
• m*4(µ) < 0, Maximum der Verteilung kleiner als NV
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
28
Lage- und Streuungsparameter V
14
Wölbung - Grafische Darstellung
m*4(µ) > 0
m*4(µ) = 0
m*4(µ) < 0
Normalverteilung
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
29
Lage- und Streuungsparameter V
Beschreibung von Häufigkeitsverteilungen
mittels grafischer Verfahren
Das Diagramm eines Boxplots ermöglicht eine komprimierte Visualisierung
einer univariaten Häufigkeitsverteilung, indem die fünf Punkte einer
Verteilung zusammengefasst dargestellt werden.
Aufbau des Boxplots:
Merkmalsausprägung
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
• Maximum
• oberes Quartil
• Median
• unteres Quartil
• Minimum
30
Lage- und Streuungsparameter V
15
Boxplots bei asymmetrischer Verteilung
Aus der konkreten Gestalt des Boxplots lassen sich Aussagen über die
empirische Verteilung ableiten.
¾ Je nachdem, wo der Median innerhalb der Box liegt, lassen sich
Aussagen über die Symmetrie der Verteilung treffen.
Merkmalsausprägung
ÆBei einer asymmetrischen Verteilung liegt
der Median nicht mittig in der Box.
Æ Ungleich breite Abstände zwischen
Extrema und unteren bzw. oberen Quartil
(„whiskers“ ) indizieren ebenfalls
Asymmetrie.
¾ Der Streubereich der Merkmalswerte wird durch die Spannweite der
Extrema gekennzeichnet.
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
31
Lage- und Streuungsparameter V
Boxplots bei symmetrischer Verteilung
Für eine exakt symmetrische Verteilung hat
das Boxplot folgende Gestalt:
¾ die Abstände zwischen Extrema und
unteren bzw. oberen Quartil sind gleich.
Merkmalsausprägung
¾ Der Median liegt mittig in der Box,
Jegliche Abweichungen davon bedeuten
Asymmetrie der empirischen Verteilung.
Bei empirischen Verteilungen ist exakte Symmetrie selten!
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
32
Lage- und Streuungsparameter V
16
Aussagen des Boxplots - Beispiel
Beispiel: Für die 250 untersuchten
Autos sei die Leistung der
Großraumlimousinen, Kombis,
Schrägheckfahrzeuge, Stufenhecklimousinen mittels der BoxplotDarstellung vergleichend dargestellt:
400
SPSS-Diagramm
250
249
248
247
246
245
300
235
229
223
214
215
216
211
Leistung [PS]
200
100
29
30
0
N=
16
20
117
97
GL
K
SH
STH
Karosserieform
Die Gruppe der Großraumlimousinen ist im Vergleich am wenigsten
asymmetrisch und weist beim Merkmal Leistung den geringsten Streubereich auf.
Den größten Streubereich haben Stufenhecklimousinen.
Extreme Leistungen im oberen Leistungsbereich gibt es bei SH und STH.
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
33
Lage- und Streuungsparameter V
Boxplots - Ausreißerproblematik
SPSS kann optional bestimmte
Objekte aus der Erstellung des
Boxplots ausschließen.
250
249
248
247
246
245
300
235
229
223
214
215
216
211
200
Leistung [PS]
Als Ausreißer werden Objekte
behandelt, deren Merkmalswerte
zwischen 1,5 und 3 Boxlängen vom
oberen oder unteren Rand der Box
entfernt sind. Die Boxlänge
entspricht dem interquartilen
Bereich.
400
100
29
30
0
N=
16
20
117
97
GL
K
SH
STH
Karosserieform
Als Extremwerte werden Objekte behandelt und gekennzeichnet
ausgewiesen, deren Merkmalswerte mehr als 3 Boxlängen vom oberen
oder unteren Rand der Box entfernt sind. Die Boxlänge entspricht dem
Interquartilsabstand.
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
34
Lage- und Streuungsparameter V
17
Boxplots für Haushaltsnettoeinkommen in Ost- und
Westdeutschland, Quelle: Datenreport 2004 - Beispiel
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
35
Lage- und Streuungsparameter V
Lage- und Streuungsparameter
Sind Sie wachsam!
Alles Klar?
Prof. Kück / R. Bernitz / Dr. Ricabal
Lehrstuhl Statistik
36
Lage- und Streuungsparameter V
18
Herunterladen