Kennwerte Univariater Verteilungen Kennwerte

Werbung
Kennwerte Univariater
Verteilungen
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
1
Kennwerte
• Beschreibung von Verteilungen durch einen
(oder wenige) Werte
• Werden auch als Parameter oder Maße von
Verteilungen bezeichnet
• Man unterscheidet:
– „Lagemaße“ oder auch „Maße der zentralen Tendenz,
welche für die Verteilung typisch sein sollen
– „Streuungsmaße“, welche die Unterschiedlichkeit der
Realisationen einer Verteilung erfassen
(Weiterhin können auch „Schiefe“ und „Steilheit“ einer
Verteilung bestimmt werden“)
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
2
1
Typische Werte
oder Lagemaße
• Modus
– Die am häufigsten auftretende Ausprägung einer
Verteilung
• Median
– Die Ausprägung, welche die Verteilung in zwei
gleich große Hälften teilt
• arithmetisches Mittel
– Der Wert, der als Durchschnittswert den
Scherpunkt einer Verteilung darstellt
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
3
Modus
• Bei gruppierten Daten ist der Modus gleich dem Wert der
Klassenmitte (Berechnung nur sinnvoll, wenn Klassenbreite
theoretisch fundiert)
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
4
2
Median
• Kennzeichnet die exakte Mitte einer
empirischen Verteilung:
– der (Meß-) Wert, der die Verteilung in zwei gleich
große Hälften teilt
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
5
Berechnungsformeln
des Medians
• Für eine Verteilung mit ungerader Fallzahl berechnet
sich der Median wie folgt:
• Und so für eine Verteilung mit gerader Fallzahl:
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
6
3
Berechnungsformeln
des Medians II
• Berechnung des Medians bei gruppierten
Daten (Interpolationsformel):
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
7
Arithmetisches Mittel
• Auch „Mittelwert“ oder „Durchschnitt“ genannt
• Setzt mindestens Intervallniveau voraus
• Wird Berechnet als Summe aller
Realisationen einer Verteilung geteilt durch
deren Anzahl (Fallzahl):
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
8
4
Arithmetisches Mittel bei
ungruppierten Daten
• Anstatt alle Werte der Tabelle zu summieren, werden
hier zunächst Produkte gebildet, die die Summe aller
Werte mit gleicher Ausprägung beschreiben. Diese
Produkte werden dann aufsummiert:
K
K
nk
1 K
x = ∑ n k ⋅ x k = ∑ ⋅ x k = ∑ pk ⋅ x k
n k =1
k =1 n
k =1
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
9
Arithmetisches Mittel
bei gruppierten Daten
• Die Berechnung des Arithmetischen Mittels wird hier
wie bei ungruppierten Daten durchgeführt, nur daß
hier anstatt der einzelnen Werte die Werte der
Klassenmitten verrechnet werden.
x=
K
K
nk
1 K
n
⋅
m
=
⋅
m
=
pk ⋅ mk
∑
∑
∑
k
k
k
n k =1
k =1 n
k =1
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
10
5
Getrimmtes
arithmetische Mittel
• Ein vom Forscher festgelegter Anteil der erhobenen
Werte wird ausgelassen
(z.B. oberere und untere 5%)
• Beispiel:
x11.1%getr =
32+38+41+42+42+55+59
= 44.1
7
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
11
Geometrisches Mittel
• Geeignet für die Mittelung von Veränderungen
die anteilsmäßig dargestellt werden
(z.B. Bierpreis * Inflationsrate)
wobei x indiziert n den einzelnen Veränderungsraten
entspricht
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
12
6
Streuungsmaße
• Informieren über die Heterogenität der Daten,
bzw. das Ausmaß ihrer Unterschiedlichkeit
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
13
Verschiedene Streuungsmaße
• Spannweite
– Abstand zwischen Niedrigsten und höchsten Wert
• Quartilsabstand
– Abstand zwischen 25% - und 75% - Quantil
• Varianz
– Durchschnittliche Quadrierte Abweichung vom
Mittelwert
• Standardabweichung
– Durchschnittliche Abweichung vom Mittelwert
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
14
7
Quartilsabstand und
Mittlerer Quartilsabstand
• IQR=Q1−Q3
wobei IQR = Quartilabstand
Q1,Q3=Quartilwerte des 1. und 3.
Quartils einer Verteilung
• Mittlerer Quartilsabstand:
mIQR =
Q3 − Q1
2
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
15
Variation
• Summe der quadrierten Abweichungen vom
Mittelwert
– Quadrieren verhindert, daß negative und positive
Abweichungen einander Aufheben
• Auch „Quadratsumme“ bzw. „Sum of
Squares“ genannt
n
SSX = ( x1 − x ) + ( x 2 − x ) + ... + ( x n − x ) = ∑ ( x i − x )
2
2
2
2
i =1
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
16
8
Varianz
• Mittlere Quadrierte Abweichung vom
Mittelwert
– Abweichungsmaß unabhängig von der Fallzahl
• Mittlere „Quadratsumme“
SSX 1 n
2
1 n 2 
2
s =
= ∑ ( xi − x ) =  ∑ xi  − x
n
n i=1
n  i=1 
2
X
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
17
Standardabweichung
• Wurzel der Varianz
– Quadrierung wird „aufgehoben“
– Abweichung kann wieder in Skaleneinheiten
dargestellt werden
n
sX =
∑ (x
i =1
− x)
i
n
2
= s 2X
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
18
9
Variationskoeffizient
• Variablen nit großen Mittelwerten weisen oft
auch große Standardabweichungen auf
• Division durch der Stabdardabweichung
durch den Mittelwert berücksichtigt dies
sX
VX =
x
3.Sitzung Peter Schmidt/Gero
Schwenk 2001
19
10
Herunterladen